.
Отредактировано Шарпер (2021-12-04 22:51:04)
Амальгама |
Привет, Гость! Войдите или зарегистрируйтесь.
Вы здесь » Амальгама » Reductor Sapiens » Новая теория памяти – прорыв или утопия? #2
.
Отредактировано Шарпер (2021-12-04 22:51:04)
Ты уж извини, но пример несовпадения теоретически возможного количества вариантов перестановок 4-х символьного набора с практически используемым, отношения к поиску не имеет.
Изначально был совсем другой пример:
Речь о количестве вариантов следования букв вообще и количестве вариантов следования букв в используемом слове.
В строке произвольной длины?
Можешь и в такой, главное не перепутай что с чем сравнить
Мы убелились, что убитый чайником паровоз не прокладывает маршрут.
Тьфу на Вас!(с)
Входным сигналом у нас является стрелочник.
Тьфу на Вас еще раз!(с)
Тактовый генератор можешь считать за паровоз
Изначально был совсем другой пример:
Нет именно этот, с набором из 4 букв и неважно на какой длине строки. С предупреждением - не путать что с чем сравнивать
Нет именно этот, с набором из 4 букв и неважно на какой длине строки. С предупреждением - не путать что с чем сравнивать
Ну тогда ответ однозначный: единственное слово АОПЖ из 24 возможных вариантов.
Не нужна, пока не получен ответ на главный неспортивный вопрос современности:
Zagar
зачем
*в сторону*
Что с нами годы делают, раньше этот вопрос звучал бы по другому.
Это верно для числового ряда и неверно уже для текстов. Вот, чтоб не сильно морочиться, набор из 4 букв А, П, О, Ж. Сравните кол-во используемых и возможных сочетаний.
Это то же самое, что и числовой ряд в четверичной системе исчисления. Никакой разницы.
Нет. Только ранее встречавшихся.
Вот тут то собака и порылась. Ты рассматриваешь уже готовую таблицу, в которой уже записана нужная информация, причем вся информация (т.е. больше туда ничего дописывать не будут). Но ты игнорируешь процесс создания (да и модификации содержимого) этой таблицы. А на этих стадиях заранее неизвестно какие символы могут использоваться, поэтому должна быть возможность использования любых символов, то есть всей таблицы ASCII, а не только букв П, Ж, О и А. Стало быть, исходно ты обязан резервировать под неё комбинаторный объем памяти.
Вместо дурацких нейросетей которые уж так жрут ресурсы, что мама не горюй, но их посему=то не критикуют, даже в слукчае их использования для, Вы не поверите, ассоциативной памяти
Я так подозреваю, что те нейросети и задачи не такого уровня сложности решают.
И, что существенно, я не понимаю почему ты считаешь свой алгоритм поиска ассоциативным. Все таки ассоциативный поиск предполагает использование неявной, косвенной и (Док прав) вероятностной информации, а у тебя исключительно строго заданные детерминированные связи, исключительно прямая информация. Если по буквам набрать л, о, ш, а, д, и, н, а, я, пробел, ф, а, м, и, л, и, я, то предложенный алгоритм не найдет в качестве результата набор символов "Овсов", он найдет имеющийся в таблице набор символов "лошадиная фамилия". А если запрос сформулировать как "фамилия лошадиная" или "лошадиная какая-то фамилия", то он вообще ничего не найдет.
Отредактировано Zagar (2022-01-02 15:40:27)
Ну тогда ответ однозначный: единственное слово АОПЖ из 24 возможных вариантов.
А из чего следует, что буквы только заглавные? Или аопж тебе уже и не слово?
Что с нами годы делают, раньше этот вопрос звучал бы по другому.
*имитирует детский голос*
Анахуа?
А из чего следует, что буквы только заглавные?
Из условия задачи:
Вот, чтоб не сильно морочиться, набор из 4 букв А, П, О, Ж.
Тут буквы все заглавные, поэтому собственно...
Что с нами годы делают, раньше этот вопрос звучал бы по другому.
Ну ответь, нахера нужны нейросети? Иди еще конкретнее - память на нейросети
Иди еще конкретнее
Ал, как думаешь, это он меня или тебя послал?
Это то же самое, что и числовой ряд в четверичной системе исчисления. Никакой разницы.
Нет, не то же самое. Из 24 вариантов, осмысленным является только один, а у чисел - все 24.
Ты рассматриваешь уже готовую таблицу, в которой уже записана нужная информация, причем вся информация
Замечательно! Т.е. процесс записи, ради автоматизации которого, все это и затеяно, Вы не видите в упор, а примеры Лукомора ничего не демонстрируют? Извините, я вообще не понимаю к чему Вы все это пишете.
А на этих стадиях заранее неизвестно какие символы могут использоваться, поэтому должна быть возможность использования любых символов, то есть всей таблицы ASCII, а не только букв П, Ж, О и А. Стало быть, исходно ты обязан резервировать под неё комбинаторный объем памяти.
Точно, какой-то Ваш собственный вариант. Не двоичный, а текстовый с резервированием места для всех возможных сочетаний. Вы извините, сколько слов из представленного набора букв написать можете? И сколько байтов на это затратите в обычном текстовом формате? Четыре! Т.е. 32 бита. А в префиксном виде - меньше 32 бит. Откуда Вы берете весь комбинаторный объем? Второй вопрос, что на представление бита нужно два адресных слова, но это другая тема, которую Вы почему-то не обсуждаете
Я так подозреваю, что те нейросети и задачи не такого уровня сложности решают.
Ага. Особенно, когда на нейросетях пытаются реализовать ассоциативную память.
я не понимаю почему ты считаешь свой алгоритм поиска ассоциативным.
Вы хотите чтобы я напомнил определение?
ассоциативный поиск предполагает использование неявной, косвенной и (Док прав) вероятностной информации, а у тебя исключительно строго заданные детерминированные связи, исключительно прямая информация. Если по буквам набрать л, о, ш, а, д, и, н, а, я, пробел, ф, а, м, и, л, и, я, то предложенный алгоритм не найдет в качестве результата набор символов "Овсов", он найдет имеющийся в таблице набор символов "лошадиная фамилия". А если запрос сформулировать как "фамилия лошадиная" или "лошадиная какая-то фамилия", то он вообще ничего не найдет.
Извините, а откуда вообще взялась какая-то вероятность в отношении случая обрыва прямой связи с абонентом и необходимости прозвона для устранения повреждения? В лжну и ту же точку могут приводить разные маршруты
Ал, как думаешь, это он меня или тебя послал?
Например сюда
Я так подозреваю, что те нейросети и задачи не такого уровня сложности решают.
Медицинские, например -
С одной стороны, нейронные сети могут выявить настолько сложные закономерности медицинских данных и предложить такие решения, которые не может найти ни один человек. Но с другой, мы до сих пор не понимаем, как именно нейронная сеть это делает. Для нас она работает в так называемом режиме black box — «черного ящика». Мы не понимаем, что у нее происходит внутри и почему она предлагает именно такие варианты.
Замечательные перспективы!
Это просто прелесть!
[url=https://news.itmo.ru/ru/science/it/news/6666/]Насколько реально в обозримом будущем понять причины, по которым сеть выдает те или иные результаты?
Безусловно, ученые постоянно предпринимают попытки понять причину таких действий, но пока результаты не так хороши. Есть даже такой пример, когда мы можем несущественно изменять данные, а нейронная сеть при этом будет выдавать уже совершенно другой результат. Например, в первом случае она распознает, что на изображении автомобиль и это правильно, но далее мы можем эту картинку специальным образом изменить — буквально в нескольких местах заменить несколько пикселов — и в этом случае нейронная сеть уже будет говорить, что на этой картинке изображен кот. Хотя человек по-прежнему увидит здесь автомобиль. Непонятно, почему нейронная сеть реагирует на изменения именно таким образом.[/url]
И это не вызывает никаких вопросов!
*имитирует детский голос*
Анахуа?
*утирает скупую мужскую слезу*
Ну ответь, нахера нужны нейросети? Иди еще конкретнее - память на нейросети
Блестящий вопрос, в контексте обсуждения входящих в него терминов.
Блестящий вопрос
Вы мне льстите. Всего лишь адекватный
Из 24 вариантов, осмысленным является только один
А какой именно один - "паж", "па", "АО", "ПАО", "аж", "жж", "по", "ОП", "ООП", "поп", попа", "папа" или "опа"?
И с чего ты взял, что поиск может относится исключительно к осмысленным словам? Возьми те же кириллические буквы и сделай поиск для монгольского текста. Как ты собрался определять осмысленность тех или иных сочетаний букв, не зная монгольского? Или даже не зная, что это монгольский, а не какой-то другой язык и не хаотический набор символов.
Не говоря уж про зашифрованный текст, где без дешифровки вообще не существует никакой возможности детекции осмысленных комбинаций.
Или, допустим, про базу номеров телефонов или, еще прикольнее, автомобильных номеров в виде буквенно-цифровых последовательностей. Как ты там будешь определять осмысленность тех или иных элементов базы?
Так что не работает эта фикция с осмысленностью. Рассыпается от даже легкого соприкосновения с действительностью.
Точно, какой-то Ваш собственный вариант. Не двоичный, а текстовый с резервированием места для всех возможных сочетаний.
Так твой вариант с П, Ж, О и А тоже ни разу не двоичный, не говоря уж про таблицу Лукомора с десятичными цифрами. И понятно, что это просто упрощенные демоверсии таблицы кодов ASCII, которой не избежать, если речь про возможность записи и поиска не заранее определенных, а вообще любых символьных последовательностей.
Извините, а откуда вообще взялась какая-то вероятность в отношении случая обрыва прямой связи с абонентом и необходимости прозвона для устранения повреждения?
Я про поиск фамилии "Овсов" по ассоциации "лошадиная фамилия", а не про обрыв провода.
Мы не понимаем, что у нее происходит внутри и почему она предлагает именно такие варианты.
Кокетничают и напускают таинственности. Всё они отлично понимают. Просто сеть не выдает набор своих правил в явном виде, ей оно и не нужно.
Например, в первом случае она распознает, что на изображении автомобиль и это правильно, но далее мы можем эту картинку специальным образом изменить — буквально в нескольких местах заменить несколько пикселов — и в этом случае нейронная сеть уже будет говорить, что на этой картинке изображен кот.
Как говорит мой айтишный знакомый: "Все проблемы ИИ всегда в качестве обучающего массива и качестве его разметки". Что интересно, у них там алгоритмы ИИ часто открытые и бесплатные, а вот обучающие массивы могут стоить очень даже немалые деньги и тщательно охраняются от доступа посторонних.
И это не вызывает никаких вопросов!
Ты не прав. Вызывает и все спецы прекрасно понимают, что ответ ИИ всегда вероятностный, а не детерминированный. Но с другой стороны, и в реальных приложениях объективно существует дефицит информации, который не позволяет получать детерминированный ответ, ответы могут только интуитивными и/или вероятностными. Док хорошо описал это на медицинских примерах.
Поэтому существуют жесткие методики оценки эффективности ИИ, когда определяется вероятность выдачи правильного решения и дальше уже по этому показателю решают можно ли этот метод применять на практике или нет. В той же медицине результаты ИИ используются только как рекомендательные, финальное решение остается за врачом.
память на нейросети
Нейронным сетям нужна память для того, чтобы хранить входные данные, весовые параметры и функции активации, как вход распространяется через сеть.
В обучении активация на входе должна сохраняться до тех пор, пока ее нельзя будет использовать, чтобы вычислить погрешности градиентов на выходе.
Нет, не то же самое. Из 24 вариантов, осмысленным является только один, а у чисел - все 24.
Да хоть ни одного.
Все равно, уже для первого записываемого в память слова нужна таблица размером (N+1)х(L+2), где
N - количество букв в алфавите,
L - Количество букв в запоминаемом слове.
То-есть, для слова АПОЖ, которое ты задумал, нужно сразу 34х6 = 204 ёкселевских ячейки.
При заполнении памяти, количество столбцов не будет расти, а количество строк будет расти с каждым новым словом нелинейно.
Отредактировано Лукомор (2022-01-03 14:37:29)
Мы не понимаем, что у нее происходит внутри и почему она предлагает именно такие варианты.
Вот проблема, высосанная из пальца.
Решение же лежит на поверхности:
Нужно обучить другую нейронную сеть, чтобы она научилась:
1. Понимать, что происходит внутри первой нейронной сети.
2. Объяснять это людям.
3. PROFIT!
Это напоминает задачу об автоматическом самовоспроизведении автоматов,
решением которой является:
3-D принтер, напечатанный на 3-D принтере.
а у чисел - все 24.
От задачи зависит.
Если в таблице предполагается хранение только простых чисел,
то осмысленными можно считать только простые числа,
и в процентном соотношении почти все числа будут неосмысленными, с огромной экономией памяти...
и это мы еще не вспоминали про вероятности, для которых осмысленными будут только значения из интервала от +0 до +1.
Отредактировано Лукомор (2022-01-03 05:09:30)
Извините, а откуда вообще взялась какая-то вероятность в отношении случая обрыва прямой связи с абонентом и необходимости прозвона для устранения повреждения?
По типам повреждений, естественно.
- Обрыв линии : P=0.39,
- короткое замыкание между жилами одной линии : P = 0.28,
- замыкание одной из жил на "землю": P = 0,17.
- "Сообщение" = замыкание между жилами соседних линий: P = 0,13.
- другие P= 0,03
Это только линейная часть.
А сколько еще есть станционных повреждений...
Это у механиков - всего один тип повреждений: "Машина не едет".
И один универсальный метод ремонта, с помощью одного универсального же инструмента - кувалды.
Отредактировано Лукомор (2022-01-03 05:10:40)
А какой именно один
Тот, который из 4 предложенных букв
И с чего ты взял, что поиск может относится исключительно к осмысленным словам?
Не к осмысленным, а к регулярным выражениям, а еже точнее последовательностям, поскольку тексты - частный случай. Ну, а пример вообще не про поиск, а про разницу между числами и словами
Так твой вариант с П, Ж, О и А тоже ни разу не двоичный
Двоичный. И табличка есть. Просто в символах проще разбираться. Казалось. Теперь вижу, что это ошибка.
Я про поиск фамилии "Овсов" по ассоциации "лошадиная фамилия", а не про обрыв провода.
Именно потерю пути к значению мы и обсуждали, когда говорили о коммутации. И даже прозвон упоминали
Кокетничают и напускают таинственности. Всё они отлично понимают. Просто сеть не выдает набор своих правил в явном виде, ей оно и не нужно.
Нет. Именно не понимают. Я приводил и другие статьи на эту тему.
Как говорит мой айтишный знакомый: "Все проблемы ИИ всегда в качестве обучающего массива и качестве его разметки". Что интересно, у них там алгоритмы ИИ часто открытые и бесплатные, а вот обучающие массивы могут стоить очень даже немалые деньги и тщательно охраняются от доступа посторонних.
Он прав лишь отчасти. Хорошему ИИ обучающие массивы ни к чему - он их сам формирует.
ИИ всегда вероятностный, а не детерминированный
В этом и есть главная проблема. Путается вероятностный ответ с вероятностной организацией системы. А прогноз всегда вероятностный, но делать его лучще на детерминированной основе. Пример - клеточные автоматы.
То-есть, для слова АПОЖ, которое ты задумал, нужно сразу 34х6 = 204 ёкселевских ячейки.
N у нас равно 2. А строки выделяются динамически и к твоим услугам терабайты оверлеев
2. Объяснять это людям.
Да. И м.б. поймут сами
Если в таблице предполагается хранение только простых чисел,
то осмысленными можно считать только простые числа,
Точнее, регулярными выражениями или целевыми
По типам повреждений, естественно.
- Обрыв линии : P=0.39,
Это вообще из другой оперы, вилимо про надкжность. А вероятность связи по исправной линии всегда 1.
Извините, а откуда вообще взялась какая-то вероятность в отношении случая обрыва прямой связи с абонентом и необходимости прозвона для устранения повреждения?
Это вообще из другой оперы, вилимо про надкжность. А вероятность связи по исправной линии всегда 1.
Итак, чему же равна вероятность связи по исправной линии в случае обрыва и необходимости прозвона?
И, заодно, чему равна вероятность связи между Одессой и Сан-Франциско по исправной радиолинии на коротких волнах?
Итак, чему же равна вероятность связи по исправной линии в случае обрыва и необходимости прозвона?
Она неисправна
И, заодно, чему равна вероятность связи между Одессой и Сан-Франциско по исправной радиолинии на коротких волнах?
Ты еще флажковую сигнализацию пьяными матросами привлеки.
Тот, который из 4 предложенных букв
"Папа", "попа" или "оппа"?
Не к осмысленным, а к регулярным выражениям, а еже точнее последовательностям, поскольку тексты - частный случай.
Я тебе привел достаточно примеров, чтобы убедиться, что возможность применения понятия осмысленности носит очень частный характер. Она применима только к текстам, да и то не ко всем и не всегда. Соответственно, и смысла говорить о ней нет.
Что до регулярности, то это понятие можно применить только к уже сформированному информационному массиву, ты опять апеллируешь к готовой таблице и игноришь стадию ее создания. До того, как ты начнешь заносить туда свою информацию, ты не будешь знать ничего о регулярностях в этой информации.
Ну, а пример вообще не про поиск, а про разницу между числами и словами
А это неважно. Мы говорим про любые символьные последовательности.
Двоичный.
Двоичный состоял бы из двух букв, скажем, "п" и "ж". Но ты сам предлагаешь 4 буквы, это уже четверичная система.
Именно потерю пути к значению мы и обсуждали, когда говорили о коммутации. И даже прозвон упоминали
Я про то, что вот эта вот хоть двоичная, хоть символьная табличная система не сможет найти фамилию "Овсов" по ассоциации "лошадиная фамилия". Потому как в ней не хватает необходимых элементов. Как минимум, генератора ассоциативных гипотез (Впальтонов, Ипподромский, Тыгдыгдымчук, Соломин, Капленикотиненко, Отработыдохлевич, Конев, Овсицер, Овсянникова и пр.), из которых можно будет выбрать что-то подходящее. Без этого никакие прозвоны не помогут.
Нет. Именно не понимают. Я приводил и другие статьи на эту тему.
Это всё звиздеж уровня "Никто не понимает как образуется борщ при варке". И если это разбирать на уровне химических реакций при варке, образования и эволюции коллоидных систем, механики и гидродинамики многофазной системы и пр. - то да, никто этого в деталях не понимает. Но для варки борща эти знания и не нужны, достаточно понимать общие принципы и схему действий, приводящую к хорошему результату.
Хорошему ИИ обучающие массивы ни к чему - он их сам формирует.
Так не бывает. Даже обычные детерминированные математические модели нуждаются во внешних данных для определения параметров модели и ее верификации.
В этом и есть главная проблема. Путается вероятностный ответ с вероятностной организацией системы
Кто путает то? Спецы это всё отлично понимают и различают. Это азы методологии машинного обучения и прочего ИИ.
А прогноз всегда вероятностный, но делать его лучще на детерминированной основе
Конечно, лучше, если есть такая возможность. Но она есть далеко не всегда.
А есть задачи, где ее вообще нет. Вот мне ИИ на яндекс.музыке собирает подборку песен, которые могли бы меня заинтересовать. И надо сказать, что у него это очень неплохо получается, его подборки мне действительно нравятся. Более того, я вижу, что чем дальше, тем подборки качественнее, он явно обучается во взаимодействии со мной. Я вот что-то не представляю себе детерминированного алгоритма, который мог бы анализировать мои очень субъективные музыкальные пристрастия. Ну наверное можно потратить тыщу лет и триллиард денег и развинтить мой мозг до атомов, построить полную модель мозга и попытаться смоделировать как мозг воспринимает музыку и как он ее определяет как хорошую или нет. Но гораздо проще запустить ИИ следить за моими плейлистами в том же яндексе, фиксировать что я из предлагаемых подборок скидываю в плейлисты, сопоставлять их с плейлистами других юзеров и пр. И, что важно, это не только намного проще, но и гораздо надёжнее.
Отредактировано Zagar (2022-01-03 09:58:53)
Все равно, уже для первого записываемого в память слова нужна таблица размером (N+1)х(L+2), где
N - количество букв в алфавите,
D - Количество букв в запоминаемом слове.
L или D?
То-есть, для слова АПОЖ, которое ты задумал, нужно сразу 34х6 = 204 ёкселевских ячейки.
Больше. В четверичной системе существует 4^4=256 вариантов 4-значных чисел. Никто ведь не запрещает многократного повторения одной и той же буквы в одном слове, так что здесь полный перебор, а не перестановки.
Полная жппа вариантов, если можно так выразиться.
А строки выделяются динамически и к твоим услугам терабайты оверлеев
Ключевое слово - терабайты. Об этом весь разговор.
Вы здесь » Амальгама » Reductor Sapiens » Новая теория памяти – прорыв или утопия? #2