Повседневное мышление (Hkfvy;uyfuky bdolyuny)

Перейти к навигации Перейти к поиску

Повседневное мышление (рациональное мышление, рассуждения на основе здравого смысла) в искусственном интеллекте (ИИ) — это подражание человеческой способности делать предположения о типе и сути обычных ситуаций, с которыми люди сталкиваются каждый день. Эти предположения включают суждения о природе физических объектов, таксономических свойствах и намерениях людей. Устройство, демонстрирующее рациональное мышление, может быть способно делать выводы, аналогичные человеческой психологии (врождённая способность людей рассуждать о поведении и намерениях людей) и наивной физике (естественное понимание людьми физического мира)[1].

Определения и характеристики

[править | править код]

Некоторые определения и характеристики здравого смысла от разных авторов включают:

  • «Знания на основе здравого смысла включает в себя основные факты о событиях (включая действия) и их последствиях, факты о знаниях и способах их получения, факты об убеждениях и желаниях. Они также включает в себя основные сведения о материальных объектах и их свойствах»[2].
  • «Знание на основе здравого смысла отличается от энциклопедического знания тем, что оно касается общих знаний, а не деталей конкретных объектов»[3].
  • Повседневное мышление — это «знание реального мира, которое может обеспечить основу для автоматического сбора и интерпретации дополнительных знаний»[4].
  • Мир повседневного мышления состоит из «времени, пространства, физических взаимодействий, людей и так далее»[5].
  • Здравый смысл — это «все знания о мире, которые мы принимаем как должное, но редко высказываем вслух»[6].
  • Здравый смысл — это «широко повторно используемое фоновое знание, которое не относится к конкретной предметной области… знание, которое вы должны иметь»[7].

Профессор Нью-Йоркского университета Эрнест Дэвис характеризует здравый смысл как «то, что типичный семилетний ребёнок знает о мире», включая физические объекты, вещества, растения, животных и человеческое общество. Обычно это исключает изучение книг, специальные знания и знание условностей; но иногда он включает в себя знания по этим темам. Например, умение играть в карты — это специализированное знание, а не «знание на основе здравого смысла»; но знание того, что люди играют в карты для развлечения, считается связанным со «здравым смыслом»[8].

Проблема повседневного мышления

[править | править код]
Система беспилотного автомобиля может использовать нейронную сеть, чтобы определить, какие части изображения кажутся соответствующими предыдущим тренировочным изображениям пешеходов, а затем моделировать эти области как медленно движущиеся, но несколько непредсказуемые прямоугольные призмы, которых следует избегать.

По сравнению с людьми существующему ИИ не хватает некоторых черт человеческого рационального мышления; в частности, у людей есть мощные механизмы для рассуждений о «наивной физике», такие как пространство, время и физические взаимодействия. Это позволяет даже маленьким детям легко делать выводы вроде «Если я скатываю эту ручку со стола, она упадёт на пол». У людей также есть мощный механизм «народной психологии», который помогает им интерпретировать предложения естественного языка, такие как «Члены городского совета отказали демонстрантам в разрешении, потому что они выступали за насилие». (Общий ИИ с трудом различает, кем являются те, кто якобы выступает за насилие, членами совета или демонстрантами.)[1][1][9]. Это отсутствие «общеизвестных знаний» означает, что ИИ часто совершает ошибки, отличные от ошибок людей, способами, которые могут показаться непостижимыми. Например, существующие беспилотные автомобили не могут рассуждать о местоположении или намерениях пешеходов точно так же, как это делают люди, и вместо этого должны использовать нечеловеческие способы рассуждения, чтобы избежать несчастных случаев[10][11][12].

Перекрывающиеся подтемы рассуждений на основе здравого смысла включают количества и измерения, время и пространство, физику, умы, общество, планы и цели, а также действия и изменения[13].

Проблема знания на основе здравого смысла — это текущий проект в области искусственного интеллекта по созданию базы данных, содержащей общие знания, которые должны быть у большинства людей, представленные в доступной форме для программ искусственного интеллекта[14], использующих естественный язык. Из-за широкого охвата знаний о рациональном мышлении этот вопрос считается одним из самых сложных в исследованиях ИИ[15]. Чтобы любая задача выполнялась так, как с ней справился бы человеческий разум, машина должна выглядеть такой же разумной, как человек. К таким задачам относятся распознавание объектов, машинный перевод и анализ текста. Чтобы выполнять их, машина должна знать те же концепции, что и человек, обладающий здравым смыслом.

Здравый смысл в интеллектуальных задачах

[править | править код]

В 1961 году Бар Гилель впервые обсудил необходимость и значение практических знаний для обработки естественного языка в контексте машинного перевода[16]. Некоторые неоднозначности разрешаются с помощью простых и легко усваиваемых правил. Другие требуют широкого признания окружающего мира, поэтому они требуют большего знания на основе здравого смысла. Например, когда для перевода текста используется машина, возникают проблемы двусмысленности, которые можно легко решить, достигнув конкретного и истинного понимания контекста. Онлайн-переводчики часто разрешают неясности, используя аналогичные или похожие слова. Например, при переводе предложений «Электрик работает» и «Телефон работает» на немецкий язык машина правильно переводит «работает» в значении «работает» в первом и как «правильно функционирует» во втором. Машина увидела и прочитала в теле текстов, что немецкие слова «рабочий» и «электрик» часто используются в комбинации и находятся близко друг к другу. То же самое относится к «телефону» и «правильному функционированию». Однако статистические прокси, которые работают в простых случаях, часто не работают в сложных. Существующие компьютерные программы выполняют простые языковые задачи, манипулируя короткими фразами или отдельными словами, но они не стремятся к более глубокому пониманию и фокусируются на краткосрочных результатах.

Компьютерное зрение

[править | править код]

Проблемы такого рода возникают в компьютерном зрении[1][17]. Например, при взгляде на фотографию ванной комнаты некоторые мелкие и видимые лишь частично предметы, такие как салфетки для лица и бутылки, можно узнать благодаря окружающим предметам (унитаз, умывальник, ванна), которые предполагают назначение комнаты. На изолированном изображении их было бы трудно идентифицировать. Кино оказывается ещё более сложной задачей. Некоторые фильмы содержат сцены и моменты, которые невозможно понять, просто сопоставив запомненные шаблоны с изображениями. Например, чтобы понять контекст фильма, зритель должен сделать выводы о намерениях персонажей и сделать предположения в зависимости от их поведения. На современном уровне техники невозможно построить и управлять программой, которая будет выполнять такие задачи, как рассуждение, то есть предсказание действий персонажей. Максимум, что можно сделать, это определить основные действия и отследить персонажей.

Роботизированные манипуляции

[править | править код]

Необходимость и важность рационального мышления для автономных роботов, работающих в реальной неконтролируемой среде, очевидны. Например, если робот запрограммирован на выполнение задач официанта на коктейльной вечеринке и видит, что поднятый им стакан разбит, то робот-официант должен не наливать жидкость в стакан, а взять другой. Такие задачи кажутся очевидными, когда человек обладает простым здравым смыслом, но гарантировать, что робот избежит таких ошибок, сложно[1].

Успехи в автоматизированных рассуждениях на основе здравого смысла

[править | править код]

Значительный прогресс в области автоматизированных рассуждений на основе здравого смысла достигнут в областях таксономических рассуждений, рассуждений о действиях и изменениях, рассуждений о времени. Каждая из этих сфер имеет общепризнанную теорию для широкого спектра выводов, основанных на здравом смысле[18].

Таксономические рассуждения

[править | править код]

Таксономия — это совокупность объектов, категорий и их отношений. Три основных отношения:

  • Объект — это экземпляр категории. Например, отдельный Tweety (имя) является экземпляром категории robin (малиновка).
  • Одна категория является подмножеством другой. Например , robin является подмножеством bird (птица).
  • Две категории не пересекаются. Например, robin не пересекается с penguin (пингвин).

Транзитивность — это один из типов вывода в таксономии. Так как Tweety является экземпляром robin, а robin является подмножеством bird, отсюда следует, что Tweety является экземпляром bird. Наследование — это ещё один тип вывода. Так как Твити является экземпляром robin, который является подмножеством bird, а bird отмечена свойством canfly (может летать), отсюда следует, что Tweety и robin обладают свойством canfly. Когда человек таксономизирует более абстрактные категории, выделение и разграничение конкретных категорий становится более проблематичным. Простые таксономические структуры часто используются в программах ИИ. Например, WordNet — это ресурс, включающий таксономию, элементами которой являются значения английских слов. Системы веб-интеллектуального анализа, используемые для сбора знаний на основе здравого смысла из веб-документов, сосредоточены на таксономических отношениях и, в частности, на сборе таксономических отношений[1].

Действие и изменение

[править | править код]

Теория действия, событий и изменений — ещё один диапазон повседневного мышления[19]. Существуют установленные методы рассуждений для областей, которые удовлетворяют ограничениям, перечисленным ниже:

  • События являются атомарными, что означает, что одно событие происходит за раз, и рассуждающий должен учитывать состояние и состояние мира в начале и в конце конкретного события, но не во время состояний, пока ещё есть свидетельство идущих изменений (прогресс).
  • Каждое изменение является результатом какого-либо события.
  • События детерминированы, то есть состояние мира в конце события определяется состоянием мира в начале и спецификацией события.
  • Есть один актор, и все события — это его действия.
  • Соответствующее состояние мира в начале либо известно, либо может быть рассчитано.

Рассуждение с учётом времени

[править | править код]

Рассуждение с учётом времени — это способность делать предположения о знании людьми времени, длительности и временных интервалов. Например, если человек знает, что Моцарт родился после Гайдна и умер раньше него, он может использовать своё знание темпорального мышления, чтобы сделать вывод, что Моцарт был моложе Гайдна, когда умер. Используемые выводы сводятся к решению систем линейных неравенств[20]. Интеграция такого рода рассуждений с конкретными целями, такими как понимание естественного языка, является более сложной задачей, потому что выражения на естественном языке имеют контекстно-зависимую интерпретацию[21]. Простые задачи, такие как присвоение временных меток процедурам, не могут быть выполнены с абсолютной точностью.

Качественное рассуждение

[править | править код]

Качественное рассуждение[22] — это форма рассуждения на основе здравого смысла, анализируемая с определённым успехом. Оно связано с направлением изменения взаимосвязанных величин. Если в какой-то экосистеме есть волки и ягнята, а количество волков уменьшится, то снизится и смертность ягнят. Эта теория была впервые сформулирована Йоханом де Клеером, который проанализировал объект, движущийся на американских горках. Теория качественных рассуждений применяется во многих областях, таких как физика, биология, техника, экология и других. Она служит основой для многих практических программ, аналогового отображения и понимания текста.

Проблемы автоматизации рассуждений на основе здравого смысла

[править | править код]

По состоянию на 2014 год существуют некоторые коммерческие системы, пытающиеся сделать использование рассуждений на основе здравого смысла значимым. Однако они используют статистическую информацию в качестве заменителя здравого смысла, когда рассуждения отсутствуют. Текущие программы манипулируют отдельными словами, но они не пытаются и не предлагают дальнейшего понимания. По словам Эрнеста Дэвиса и Гэри Маркуса, пять основных препятствий мешают созданию удовлетворительного «повседневного мышления»[1].

  • Во-первых, некоторые области, связанные с рассуждениями на основе здравого смысла, изучены лишь частично. Индивиды далеки от всестороннего понимания таких областей, как общение и знание, межличностные взаимодействия или физические процессы.
  • Во-вторых, ситуации, которые кажутся легко предсказуемыми или предполагаемыми, могут иметь логическую сложность, не охватываемую человеческим здравым смыслом. Некоторые аспекты подобных ситуаций изучены и хорошо понятны, но есть много отношений, которые неизвестны даже в принципе и как их можно представить в форме, пригодной для использования компьютерами.
  • В-третьих, рассуждения на основе здравого смысла включают правдоподобные рассуждения. Это требует разумного вывода из того, что уже известно. Правдоподобные рассуждения изучались в течение многих лет, и было разработано множество теорий, включающих вероятностные рассуждения и немонотонную логику. Она принимает различные формы, включая использование ненадёжных данных и правил, выводы из которых иногда не являются определёнными.
  • В-четвёртых, есть много областей, в которых очень часто встречается небольшое количество примеров, тогда как существует огромное количество очень редких примеров.
  • В-пятых, при формулировании презумпций сложно различить и определить уровень абстракции.

По сравнению с людьми, по состоянию на 2018 год существующие компьютерные программы крайне плохо справляются с современными эталонными тестами на «здравый смысл», такими как Winograd Schema Challenge[23]. Проблема достижения компетентности человеческого уровня в задачах требующих знаний на основе здравого смысла считается, вероятно, «сильным ИИ» (то есть для её решения потребуется способность синтезировать интеллект человеческого уровня)[24][25]. Некоторые исследователи считают, что данных обучения с учителем недостаточно для создания общего искусственного интеллекта, способного рассуждать на основе здравого смысла, и поэтому обратились к менее другим методам обучения[26].

Подходы и методы

[править | править код]

Исследование рационального мышления разделено на подходы, основанные на знаниях, и подходы, основанные на машинном обучении и использовании больших корпусов данных с ограниченным взаимодействием между этими двумя типами подходов. Существуют также подходы краудсорсинга, пытающиеся создать базу знаний, связывая коллективные знания и вклад неспециалистов. Подходы, основанные на знаниях, можно разделить на подходы, основанные на математической логике.

В подходах, основанных на знаниях, эксперты анализируют характеристики выводов, которые необходимы для рассуждений в определённой области или для определённой задачи. Подходы, основанные на знаниях, состоят из математически обоснованных подходов, неформальных подходов, основанных на знаниях и крупномасштабных подходов. Математически обоснованные подходы носят чисто теоретический характер, и вместо программы получается печатная статья. Работа ограничена диапазоном предметных областей и методов рассуждений, которые рассматриваются. В неформальных подходах, основанных на знаниях, теории рассуждений основаны на анекдотических данных и интуиции, являющихся результатом эмпирической поведенческой психологии. Неформальные подходы распространены в компьютерном программировании. Два других популярных метода извлечения знания о здравом смысле из веб-документов включают веб-майнинг и краудсорсинг.

COMET (2019), который использует как архитектуру языковой модели OpenAI GPT, так и существующие базы знаний на основе здравого смысла, такие как ConceptNet, утверждает, что делает выводы на основе здравого смысла на уровне, приближающемся к человеческим эталонным показателям. Как и многие другие текущие разработки, COMET чрезмерно полагается на поверхностные языковые шаблоны, и считается, что ему не хватает глубокого человеческого понимания многих концепций повседневного мышления. Другие подходы на основе языковых моделей включают обучение визуальным сценам, а не только тексту, и обучение текстовым описаниям сценариев, связанных с физикой следующей из здравого смысла[7].

Примечания

[править | править код]
  1. 1 2 3 4 5 6 7 Ernest Davis; Gary Marcus (2015). "Commonsense Reasoning and Commonsense Knowledge in Artificial Intelligence". Communications of the ACM. Vol. 58, no. 9. pp. 92—103. doi:10.1145/2701413. Архивировано 25 августа 2015. Дата обращения: 3 апреля 2023.
  2. McCarthy, John. «Artificial intelligence, logic and formalizing common sense.» Philosophical logic and artificial intelligence. Springer, Dordrecht, 1989. 161—190.
  3. Tandon, Niket (22 February 2018). "Commonsense Knowledge in Machine Intelligence". ACM SIGMOD Record. 46 (4): 49—52. doi:10.1145/3186549.3186562.
  4. Matuszek, Cynthia, et al. «Searching for common sense: Populating cyc from the web.» UMBC Computer Science and Electrical Engineering Department Collection (2005).
  5. "How to Teach Artificial Intelligence Some Common Sense". Wired (англ.). 2018-11-13. Архивировано 14 апреля 2021. Дата обращения: 11 февраля 2021.
  6. "How to Teach Artificial Intelligence Some Common Sense". Wired (англ.). 2018-11-13. Архивировано 14 апреля 2021. Дата обращения: 11 февраля 2021.
  7. 1 2 Pavlus, John (2020-04-30). "Common Sense Comes to Computers". Quanta Magazine (англ.). Архивировано 9 марта 2021. Дата обращения: 3 мая 2020.
  8. Davis, Ernest (25 August 2017). "Logical Formalizations of Commonsense Reasoning: A Survey". Journal of Artificial Intelligence Research. 59: 651—723. doi:10.1613/jair.5339.
  9. Winograd, Terry (January 1972). "Understanding natural language". Cognitive Psychology. 3 (1): 1—191. doi:10.1016/0010-0285(72)90002-3.
  10. "Don't worry: Autonomous cars aren't coming tomorrow (or next year)". Autoweek. 2016. Архивировано 25 марта 2018. Дата обращения: 24 марта 2018.
  11. Knight, Will (2017). "Boston may be famous for bad drivers, but it's the testing ground for a smarter self-driving car". MIT Technology Review. Архивировано 22 августа 2020. Дата обращения: 27 марта 2018.
  12. Prakken, Henry (31 August 2017). "On the problem of making autonomous vehicles conform to traffic law". Artificial Intelligence and Law. 25 (3): 341—363. doi:10.1007/s10506-017-9210-0.
  13. Thomason, Richmond (2003-08-27). "Logic and Artificial Intelligence". Архивировано 11 мая 2021. Дата обращения: 3 апреля 2023. {{cite journal}}: Cite journal требует |journal= (справка)
  14. Artificial intelligence Programs. Дата обращения: 3 апреля 2023. Архивировано 14 апреля 2021 года.
  15. Artificial intelligence applications. Дата обращения: 3 апреля 2023. Архивировано 2 мая 2021 года.
  16. Bar Hillel Artificial Intelligence Research Machine Translation. Дата обращения: 3 апреля 2023. Архивировано 7 мая 2021 года.
  17. Antol, Stanislaw, et al. «Vqa: Visual question answering Архивная копия от 26 ноября 2020 на Wayback Machine.» Proceedings of the IEEE international conference on computer vision. 2015.
  18. Taxonomy. Дата обращения: 3 апреля 2023. Архивировано 4 сентября 2017 года.
  19. Action and change in Commonsense reasoning. Дата обращения: 3 апреля 2023. Архивировано 8 августа 2022 года.
  20. Temporal reasoning.
  21. Liu, Hugo, and Push Singh. «Commonsense reasoning in and over natural language Архивировано {{{2}}}..» International Conference on Knowledge-Based and Intelligent Information and Engineering Systems. Springer, Berlin, Heidelberg, 2004.
  22. Qualitative reasoning. Дата обращения: 3 апреля 2023. Архивировано 6 марта 2015 года.
  23. The Winograd Schema Challenge. cs.nyu.edu. Дата обращения: 9 января 2018. Архивировано 9 января 2018 года.
  24. Yampolskiy, Roman V. «AI-Complete, AI-Hard, or AI-Easy-Classification of Problems in AI.» MAICS. 2012.
  25. Andrich, C, Novosel, L, and Hrnkas, B. (2009). Common Sense Knowledge. Information Search and Retrieval, 2009.
  26. Smith, Craig S. (2020-04-08). "Computers Already Learn From Us. But Can They Teach Themselves?". The New York Times. Архивировано 30 апреля 2020. Дата обращения: 3 мая 2020.