Страницы: 1 2 3 4 5 ... 8 След.
RSS
Нейросети, Это новый прорыв?
В общем , в заголовке уже все сказано. Интересно услышать, кто что думает. Нейросети это новая революция?, что мы пока не замечаем ( а слона то я и не заметил)... типа ткацкого станка или появления интернета, или вещь более менее рядовая?
Пока думаешь, что сказать, — делай реверанс! Это экономит время.
Цитата
janmik пишет:
Нейросети это новая революция?

И да, и нет. Это с какой стороны посмотреть.
С точки зрения практической - да, нейросети получили широкое распространение и достаточно эффективно применяются для решения ряда задач.
А с точки зрения теории... никто толком не понимает как они, сука, это делают.
Тот случай, когда практика обогнала теорию.
Революция. Но вчерашняя, ещё прошлого века.

Всплеск применения сегодня - это не столько по причине текущего развития самих нейронных сетей, а по причине широкой доступности вычислительных мощностей и данных для обучения.

С теорией там нет никаких проблем.
Цитата
Алексей Вячеславович Гуськов пишет:
С теорией там нет никаких проблем.
Вот тут есть другое мнение: Структурно-функциональный анализ и синтез глубоких конволюционных нейронных сетей
Цитата

В качестве таких наиболее важных ограничений возможностей
ГКНС можно отметить следующие:
1) большинство существующих и наиболее
успешных архитектур ГКНС предназначены
для обработки регулярных массивов данных и
не способны работать со сложно структурированными и неоднородными данными;
2) сам процесс конструирования и обучения
ГКНС является сложным, длительным и нестабильным, т.е. не всегда завершается гарантированным успешным результатом.
Первая из указанных проблем является источником критического ограничения нынешней функциональности ГКНС, поскольку именно такие нерегулярные и сложно структурированные данные об
окружающей среде необходимо анализировать в процессе решения задачи управления мобильными объектами в быстро меняющейся обстановке. При этом
ГКНС, приобретающие знания путём обучения на
примерах, должны плотно взаимодействовать с базами данных и знаний (в том числе геопространственных данных), где информация также представлена в
виде графовых структур, вообще говоря, произвольного вида.
Вторая проблема связана с тем, что на сегодняшний день в области глубокого обучения сложилась
классическая ситуация, когда практика намного опережает теорию. Множество научных групп и прикладных разработчиков используют глубокое обучение (Deep Learning) и глубокие конволюционные
нейронные сети (CNN, ГКНС), получают при этом
state-of-the-art результаты, но никакой теории построения и обучения CNN не существует. Есть лишь некоторые наборы стандартных топологий сетей
(AlexNet [1], GoogleNet [2] и т.п.) и рецептов их обучения. Периодически появляются некоторые эвристические новации (например, MFM-пулинг [3]) без
какого-либо теоретического обоснования, и они закрепляются в пуле ходячих рецептов, если дают какие-то полезные результаты. Такой способ развития
аппарата машинного обучения на основе CNN без теоретического обоснования сопряжён с необходимостью перебора конфигураций сети и стратегий обучения при решении каждой конкретной задачи, а для
этого требуется многократно прогонять большие (или
сверхбольшие) объёмы обучающих и тестовых данных через процедуру обучения с использованием
мощных вычислительных кластеров.

Конечно, желательно иметь общую теорию построения и обучения CNN, которая была бы способна
ответить на следующие основные вопросы:
– Какова должна быть сложность CNN для решения задач определённого типа на данных определённой сложности при обучении на выборках определённого размера?
– Как оптимально формировать структуру глубокой сети для конкретных типов задач и конкретных типов данных?
– Как оптимально формировать стратегию обучения глубокой сети для конкретных типов задач
и конкретных типов данных?
– От чего зависит скорость обучения глубокой сети, и как на неё влиять в процессе обучения?
– Как заранее оценить достижимые результаты
некоторой заданной глубокой сети при её обучении в некоторой конкретной задаче (тип
данных, выборка и т.п.)?
– Как предсказать или хотя бы семантически интерпретировать структурные описания, которые порождает глубокая сеть на разных уровнях в результате обучения в некоторой конкретной задаче (тип и характеристики данных,
тип и характеристики выборки и т.п.), т.е. как
превратить CNN из «черного ящика» в «прозрачный»?
К сожалению, никаких предпосылок к созданию
такой теории пока нет. Неясен даже математический
аппарат, который позволил бы вести подобный теоретический анализ поведения таких сложных объектов,
как CNN. Однако это не значит, что всякая систематическая работа по теоретическому анализу и развитию CNN сегодня невозможна. Представляется, что,
напротив, она возможна и даже необходима, но с менее амбициозной целью – не моделировать и предсказывать характеристики и поведение CNN, а систематизировать и обобщать те удачные архитектуры и
«рецепты», о которых шла речь выше. Такую теорию/методику предлагается назвать теорией структурно-функционального анализа и синтеза (СФАС)
глубоких конволюционных нейронных сетей (ГКНС).
СФАС должна ответить на следующие вопросы:
– Из каких типовых структурно-функциональных
элементов (СФЭ) могут строиться глубокие сети?
– Каковы необходимые математические свойства этих элементов, и, соответственно, каковы могут быть их различные алгоритмические
реализации?
– Какие комбинации СФЭ являются допустимыми и эффективными с точки зрения построения
и обучения глубоких сетей?
– Каковы возможные пути построения и обучения
глубоких сетей для анализа и распознавания
нерегулярных, неоднородных или сложно структурированных данных (нерегулярные массивы,
данные различного размера и различной природы, деревья, скелеты, графовые структуры,
2D-, 3D- и ND-облака точек, триангулированные поверхности, аналитические описания
данных и т.п.)?
Это, скажем так, не очень авторитетное мнение. Но даже и там говорится, фактичнски, просто о том, что те, кто нейронные сети применяет, не очень заботятся теорией. Что в значительной степени правда, но что не означает автоматически отсутствия теории.

Я сам не являюсь глубоким специалистом в этой области, но активно сотрудничаю с таковыми. В областях, где задача стоит сильно сложнее, чем найти физиономию на картинке, теорией озабочены сильнее.
Цитата
Алексей Вячеславович Гуськов пишет:
Это, скажем так, не очень авторитетное мнение. Но даже и там говорится, фактичнски, просто о том, что те, кто нейронные сети применяет, не очень заботятся теорией. Что в значительной степени правда, но что не означает автоматически отсутствия теории.
Возможно, конечно, я сильно остал от жизни, но вот лично мне приходилось сталкиваться именно с таким, такскть, "инженерным" подходом к созданию нейросетей.
Цитата
Алексей Вячеславович Гуськов пишет:
В областях, где задача стоит сильно сложнее, чем найти физиономию на картинке, теорией озабочены сильнее.
Это бесспорно. Но это автоматически не означает наличия такой теории.

Вообще, нейросети пытаются моделировать некоторые стороны высшей нервной деятельности, по существу работу мозга, но, насколько я понимаю, такой полной теории ВНД пока не создано. Собственно, само большое разнообразие типов нейросетей говорит об отсутствии единой теории.
Это примерно как с единой теорией поля - все знают, что она есть (должна быть), но вот пока никак...
А может я и не прав.
Цитата
Техник пишет:
Вообще, нейросети пытаются моделировать некоторые стороны высшей нервной деятельности, по существу работу мозга, но, насколько я понимаю, такой полной теории ВНД пока не создано. Собственно, само большое разнообразие типов нейросетей говорит об отсутствии единой теории.
Это примерно как с единой теорией поля - все знают, что она есть (должна быть), но вот пока никак...
А может я и не прав.

Думаю, в реальности всё-таки всё несколько иначе:

Нейронная сеть - ни коим образом не есть попытка воспроизвести работу мозга. Нейронная сеть на практике - это, как правило, просто инструмент для решения вполне конкретных задач. То, что принципы работы таких сетей действительно схожи с принципом функционирования биологических сетей нервных клеток, не должно вводить в заблуждение.

Гвоздь мы забиваем молотком, доски пилим пилой, а стену красим кистью. На каждую задачу свой инструмент. Никто не старается создать универсальный инсрумент на все случаи жизни. Да и единая теория инструментов вряд ли сильно полезна будет на практике. Вот с нейронными сетями всё то же самое: рожи в метро распознавать - одна, погоду предсказывать - другая, текст переводить - третья.
Цитата
Алексей Вячеславович Гуськов пишет:
Нейронная сеть - ни коим образом не есть попытка воспроизвести работу мозга. Нейронная сеть на практике - это, как правило, просто инструмент для решения вполне конкретных задач. То, что принципы работы таких сетей действительно схожи с принципом функционирования биологических сетей нервных клеток, не должно вводить в заблуждение.
Нейросеть - инструмент, да. Так ведь и наш мозг тоже универсальный инструмент! Высшая форма инструмента, инструмент инструментов, гиперинструмент, если угодно.

Говоря "нейросеть" мы вольно-невольно подразумеваем "искусственный интеллект", собственно ради этого всё когда-то затевалось, но вот сильного интеллекта, сравнимого с человечьим, пока не получилось и вряд ли в обозримом будущем получится, а получился в качестве побочного продукта некий инструмент - корявенький и неотесанный "чёрный ящик", каким-то непостижимым образом выдающий иногда полезный результат. Так вот неплохо было бы сделать этот "ящик" прозрачным, чтобы научно обоснованно, со знанием дела, создавать под каждую конкретную задачу оптимальный инструмент, позволяющий с заданными ресурсами получать максимальный результат, либо достигать заданный результат используя минимум ресурсов.
Как-то так.
По-моему, в противостоянии универсальный инструмент -- специальный инстпумент нет однозначного решения.
В смысле развития существует и специализация, когда из универсального кремневого ножа получились специальные ножи, мечи, резцы и т.д. Так и универсализация - всякие МФУ, кухонные комбайны и компьютеры.

В сфере научных теорий обычный путь,это исследование конкретностей и дальнейшее обобщение. Однако, если вдуматься - философия и математика предполагают как раз обратный путь. Т.е. применение математики в изучении конкретного, это переход от абстракций к конкретному.
Нашел в dxdy такое видео
https://www.youtube.com/shorts/nmHzvQr3kYE
Народ склоняется к тому, что это фейк.
?
Изменено: eLectric - 20.08.2023 13:01:57
Страницы: 1 2 3 4 5 ... 8 След.

Нейросети


Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее