Финлайсон: искусственный интеллект не создан даже на уровне таракана

Posted: 2014-02-17
Written by: EU Network

От редакции: публикуем интересное интервью Владислава Ужулиса с американским ученым Марком Финлайсон (Mark Finlayson). Финлайсон,  — американский доктор наук одного из лучших университета мира - Массачусетского технологического института (MIT). Он работает в научном центре MIT по компьютерным наукам и искусственному интеллекту. Финлейсон 23 января был в Риге, где прочитал лекцию в Балтийской международной академии по проблематике когнитивных и социальных наук.

finlayson.jpg

- Расскажите о вашей научной карьере?

- Я защитил докторскую диссертацию в MIT в 2012 году, там же работаю в лаборатории по компьютерным наукам и искусственному интеллекту. Все последние годы я занимаюсь изучением искусственного интеллекта, а также вопросами применением когнитивных наук в социальных и гуманитарных дисциплинах. Меня интересует, как можно извлечь частно-употребляемые нарративные структуры из текста, то есть я смотрю, каким образом нарративная структура влияет на наш образ мышления, каким образом знания кодируются в этих структурах и каким образом эти знания могут быть проанализированы с помощью компьютеров.

Я родился в штате Мичиган, рядом с Детройтом, который недавно объявил себя банкротом. Я получил степень бакалавра в университет Мичигана и изучал электронные инженерные науки, физику, математику, философию. А потом я сделал магистратуру в MIT, потом работал в нескольких новых компаниях (которые только открылись), а также в исследовательских лабораториях Линкольна при MIT (MIT Lincoln Labs). И так я работал в различных проектах, но сейчас я специализируюсь в области искусственного интеллекта.

- Вы участвовали в проектах DARPA - агентства передовых оборонных исследовательских проектов (Министерство обороны США)?

- Да, мы получили от них несколько грантов. В США наука финансируется из различных источников. Всего правительственные гранты на исследования MIT составляют около 80% от общего финансирования, остальное - частные фонды. Крупнейшим заказчиком грантов (33,3%) является Национальный институт здоровья (National Institutes of Health). Другой значимый заказчик - Национальный научный фонд (National Science Foundation). Кроме того, мы получаем достаточно много финансирования из военных источников. DARPA – это только один из военных источников, который финансирует науку. Есть еще Air Force Office of Scientific Research (AFOSR), Office of Naval Research (ONR), Army Research Labs, Office of the Secretary of Defence Minevra program (финансируют социальные науки для военных нужд).

Хочу заметить, что DARPA не диктует тип исследований, это отличительная черта заказов корпорации BOEING. Мы занимаемся своими исследованиями, пишем заявки на гранты и если они считают эти исследования созвучными с их политикой, они их финансируют, но они не диктуют условия.

- Какие ваши самые большие достижения?

Я создал систему, которая использует теорию русского ученого лингвиста и фольклориста Владимира Проппа. Моя система в состоянии выучить теорию нарации напрямую из имеющихся данных. Я создал самый большой глубоко-анализируемый корпус нараций– коллекцию русских сказок, газетных публикаций и т.д. – но они семантически глубоко аннатируемы (включают в себя тета-роли). Это 120 тыс. и более слов, в зависимости от подхода к их счету. Это ресурс, который ученые могут во всем мире использовать для изучения естественного языка и нарации.

Я также создал инструмент – the story workbench – это довольно общий инструмент для аннотации естественного языка. Он сделан на основе английского, но сейчас мы работаем над испанским, арабским, фарси и другими языками. Это довольно сложный механизм, но он доступен в интернете. Он в прямом доступе. Его уже используют исследователи в MIT и других странах. Я также создал WordNet Library – его уже загрузили 15 тыс. раз со всего мира. особенно много скачиваний из Китая, Индии, Великобритании. Я каждую неделю получаю послание от кого-то по этой программы.

Моя мечта создать мировой культурный атлас историй (литературный жанр). Сейчас имеется коллекции фольклора для отдельных культур, для отдельных периодов. Но мы пока не можем разбить все эти истории на их фундаментальные компоненты и мы не можем их изучить на основе этого фундаментального компонента. Я хочу сделать культурный нарационый ДНК-  я хочу сделать ДНК для культур и хочу быть в состоянии сравнить культуры на основе их историй, а именно, что истории России и Германии различаются конкретным образом, или что Германия соотносится с США определенным способом и это отражается в историях. Я также хочу быть в состоянии провести диахронный анализ культур (историческое развитие во времени). А также хочу сравнивать культуры в географическом пласте.

Для того, чтобы это сделать нужны прежде всего данные, кроме того автоматическая обработка языка имеет свои ограничения – некоторые вещи можно сделать автоматически, но некоторые вещи сложно сделать и сложно их сделать хорошо. Мы делаем сначала автоматическую обработку, а потом люди исправляют полученные данные, и тогда уже эти полученные данные являются нашим рабочим материалом. Но это очень дорого платить людям за такую работу. Итак, самое большое препятствие – это несовершенство автоматической обработки языка, что затрудняет собрание материала. Сейчас мы все же главным образом базируемся на человеческом факторе в обработке данных, но надеюсь, что в будущем  автоматическая обработка языка усовершенствуется до такой степени, что позволит более эффективно собирать данные. Это не проблема мощности компьютерных технологий – персональный компьютер может это сделать.

- На каком этапе находится развитие искусственного интеллекта (ИИ)?

- Это очень тонкий вопрос, и ответ должен быть таким же. Если мы посмотрим на таракана, то он делает много вещей, которых компьютер еще сделать не может, к примеру, видение многих предметов в пространстве, способность отслеживать их передвижение, избегать препятствий, и интеграция всего множества аспектов в один маленький "пакет". Имеются, однако, задания, которые компьютеры могут великолепно сделать – но они обычно фокусируются на исполнении одного конкретного задания, к примеру, мы можем запрограммировать компьютер великолепно играть в шахматы, мы можем их запрограммировать так, чтобы они обыграли самого лучшего игрока. Но мы знаем, что шахматная доска разбита 8 Х 8, и если наш компьютер запрограммирован играть именно на такой доске, то если ее сделать 9Х8, он уже не может адекватно играть, а человек сможет.

Итак, компьютерный интеллект очень уязвим - он создан только в рамках существования конкретного задания, а вот человеческий интеллект может и не быть таким мощным относительно данного задания, оно значительно более обширный. У человеческого интеллекта есть широта и ограниченная глубина, а у компьютера – есть глубина, но нет широты.

Одним из важных задач в компьютерном интеллекте – это сделать их интеллект более подвижным, более обобщенным умственным механизмом, чтобы они могли применить знания из предыдущего задания, из освоенных ранее данных.

Всегда очень сложно делать предсказания на тему будущего, но наверное, все же пройдут десятилетия, прежде чем мы действительно сделаем высоко-интеллектуальные машины. Тем более, что сейчас людей больше интересуют инженерные решения проблем. Похоже, что доминирует тенденция создавать все больше именно специализированных машин, а не вообщем более умных машин, что было целью в прошлом.

- Может ли искусственный интеллект помочь понять, что такое человек на самом деле?

- Я думаю самый большой научный вызов современности на ближайшие 50 лет - это понять природу человеческого интеллекта, что мы люди за механизмы, как мы думаем и чем мы отличаемся от животных. Мы сейчас только начинаем понимать, как формулировать данную проблему, своего рода сейчас мы находимся на преднаучной стадии развития, если речь идет о данной проблеме. Но мы даже не можем понять как мышь или кот думают, мы полностью не знаем как они видят, к примеру, – мы не можем научить компьютер следить за движением одного взятого человека, а вот мышь может. Конечно же, мы это изучаем и у нас имеются какие-то идеи, но вообщем нам еще далеко до полного понимания всего целостного механизма.

Пока мы можем понять поведение, к примеру, Caenorhabditis червяка, длиной в 1 мм – у них очень простая нервная система - всего несколько сотен нейронов, и я не эксперт в этой области, но похоже, что только за последние 20 лет мы смогли понять функции этих нейронов и смогли создать адекватную компьютерную модель нервной системы этого червяка.

- Как быстро идет научный прогресс в области изучения искусственного интеллекта?

- Я думаю, что сейчас можно говорить об определенном тупике. Десятилетия назад был большой оптимизм, но сейчас мы только начинаем осознавать всю грандиозность задачи.

В области искусственного интеллекта были такие знаменитые ученые, как Джордж Миллер, Роджер Шанк, ученые из Darthmouth Conference, которые и ввели понятие -  искусственный интеллект. Но это все люди до 80-х гг. В 80-е годы больший акцент стал делать на статистических подходах.

Еще раз повторю, мы не сумели создать интеллект аналогичный интеллекту таракана. Конечная цель - создание интеллекта сравнимого с человеческим пока недостижима.

- Социальные науки исследует не отдельного человека, а общество. Интеллект человека во многом есть проекция его конкретной культуры и языка. Есть же русские, американцы, китайцы. Если в теории создавать искусственный интеллект сравнимый с человеческим, то какой культурный код  берется за основу? Или, можно сказать, что есть человек и его интеллект, как нечто общее и единое для всех людей, независимо от исторического периода и конкретной культуры?

- Психологи скажут, что есть параметры и поведение, которое универсально для всех людей, а есть то, что определяется культурой. До сих пор, когнитивная наука старалась концентрироваться только на общих характеристиках, таких как способность говорить, чтение, зрение и т.д. Есть и область психологии культуры, фокусирующейся на кросс-культурных различиях в поведении, традиции, восприятии. Этого очень немного, но когнитивная наука – очень молодая сфера исследований (ей только около 40-50 лет).  Нет достаточного количества когнитивых ученых, хотя область очень быстро развивается.

Пока нам сложно представить, как изучать то, как культура влияет на когнитивные репрезентации, поведение. И я вижу себя именно занимающимся такого рода проблемами, начинающимися с того, что надо определить методы, технику исследования. И я согласен что по крайней мере на каком-то уровне китаец, американец и немец думают по-другому, и поэтому меня интересует нарация, потому что она репрезентация культуры и отражает культуру.

В области искусственного интеллекта имеются две категории ученых. Первых интересует  человеческие когнитивные репрезентации, как человек запрограммирован, чтобы потом запрограммировать подобным образом машины. Вторых интересует только то, как научить компьютеры делать умные вещи, и их не обязательно интересует то, чтобы запрограммировать машины, чтобы они это делали так же как люди. Если мы сравним как машины и люди играют в компьютерные игры, то люди могут подумать вперед на несколько ходов, а машины запрограммировали думать вперед на много ходов, рассчитывая миллиарды возможных вариаций, и несмотря на это, мастера все же относительно хорошо с ними играют, но очевидно, что они по-другому обрабатывают информацию.  Но если твоя задача просто научить машину хорошо играть в шахматы, не нужно для этого изучать человека.

Социальные науки изучают социумы и человека в них, но пока на когнитивном уровне что-то делается, но относительно немного, например эволюция, язык. Но пока мы только в начале пути того, каким образом моделировать взаимодействие человека и социума. Это интересная область, и в течении следующих нескольких десятилетий много будет сделано, потому что появляются необходимые сложные инструмента для изучения таких вопросов.

- Если для создания искусственного интеллекта необходимо использовать данные социальных наук, то не грозит ли нагромождением ошибок. Социальные науки не совсем точный инструмент в силу их специфики, вдруг в используемых данных будут ошибки?

- Ваш вопрос о возможных ошибках в материалах прошлого и каким образом это может отобразиться на данных, конечно, важен. Но на данном этапе я не очень бы волновался на эту тему, потому что у нас сложности даже с формулировкой вопросов. Разрешение этой дилеммы - это вопрос будущего.  

Касательно будущего развития искусственного интеллекта - в сфере моделирования человеческого мышления – мы все еще на очень ранних стадиях. Здесь даже деньги не помогут, можно дать много миллиардов на исследования, но это не приведет к быстрому созданию искусственного интеллекта.

Оригинал: Rus.apollo.lv

Comments

Gravatar
??????? 2014-02-17

Очень качественное интервью, спасибо!

Post a comment