E-Z Reader (E-Z Reader)
Необходимо проверить качество перевода, исправить содержательные и стилистические ошибки. |
E-Z Reader (от англ. «Easy Reader», «Читающий легко») — самая популярная модель естественного чтения текста человеком на средней скорости по целым словам в когнитивной психологии.
Хотя у этой модели есть целый набор аналогичных по концепции конкурирующих теорий, таких как SWIFT, но E-Z Reader наиболее полно объясняет экспериментально наблюдаемые факты. В их числе пропуск 30 % и более слов при чтении баллистическим перескоком саккад глазного яблока, предварительный анализ следующего слова в размытом изображении в парафовеальной области, возможность самого чтения по словам за счёт предварительного орфографического разбора и многие другие эффекты в сложном процессе чтения человеком.[1][2][3][4]
Практическое значение модели E-Z Reader
[править | править код]Модель E-Z Reader имеет компьютерное воплощение и в данном случае является разновидностью искусственного интеллекта. Экспериментальное сравнение поведения искусственного интеллекта, реализованного через E-Z Reader, с поведением человека позволяет когнитивным психологам глубже понимать процессы чтения человека. В том числе, модель используется для изучения дислексии и определения её причин в рамках этапов обработки текста в E-Z Reader.[5] Одно из важнейших открытий, сделанных за счёт применения E-Z Reader, заключается в том, что нейросети лексического разбора (см. L1 и L2 далее) имеют логарифмическую зависимость времени срабатывания от частотности слов и если это время больше максимального позволяющего координировать параллельно работающие нейросети при чтении, то происходит «развал» быстрого чтения по словам человеком и возврат на чтение через высшую нервную деятельность, то есть чтение по слогам. Это открытие было использовано в федеральных программах начальной школы США, в которые было введено заучивание учениками написания 300 самых частых слов (100 в первом классе Grade 1 и ещё 200 во втором классе Grade 2). Знание о том, что L1 не использует анализ по слогам, а использует орфографическую модель для анализа обычно в терминах морфем, привело к отказу от обучения слоговому чтению в начальной школе США в пользу чтения целыми морфемами (корнями, приставками, суффиксами).[6] На основании модели E-Z Reader были разработаны списки частотных слов для обучения школьников[7]. Модель E-Z Reader и её аналоги, такие как SWIFT, опровергли теории, что чтение по целым словам здорового человека состоит из последовательного анализа букв: на самом деле все буквы, попавшие в жёлтое пятно, должны расшифровываться параллельно. Нарушение этой нормальной работы нейронных сетей позволило сформулировать название нового вида дислексии — Surface Dyslexia.
Такие модели, как E-Z Reader и его аналоги (SWIFT), позволили осознать, что перемещение глазного яблока и особенно лишние перемещения для исправления ошибок чтения (регрессия) являются самым критическим фактором, сдерживающим скорость чтения. Эти данные были использованы при разработке популярных методик скорочтения с фиксацией глазного яблока неподвижно, как, например, методика Spritz Оксфордского университета.[8]
Нейросети-модули E-Z Reader
[править | править код]Модель состоит из набора «модулей», которые на практике являются группами нейронных сетей. Томограмма головного мозга с анализом по саккадам, на каком этапе чтения находится мозг, показывает, что хотя обычно один «модуль» тождественен физиологически участку головного мозга, но во многих случаях требуется срабатывание совместно нескольких участков мозга для выполнения операции чтения. Тем не менее, томограмма головного мозга даёт возможность понять, что E-Z Reader и его аналоги, не являются психологической абстракцией, а доказуемо имеют физиологическое воплощение в головном мозге. Модулям модели реально соответствуют конкретные нейронные сети, которые, конечно, могут быть устроены несколько иначе в головном мозге, но типы сетей из модели реально существуют и выявляются по МРТ.[9]
Модель E-Z Reader реализуется следующим набором нейросетей[9][10]:
- V (Visual) — визуальное оптическое распознавание текста;
- M1 (Movement 1) — планирование саккад с возможностью их отмены по новым данным от L1;
- M2 (Movement 2) — управление движением мышц глаза в саккаде без возможности отмены со стороны L1;
- L1 (Lexicon 1) — орфографический разбор слова и эвристики «знакомого слова» для саккад-пропусков слов;
- L2 (Lexicon 2) — определение слова по словарю когортным методом с семантическими эвристиками;
- I (Integration) — интеграция слов во фразы, выявление ошибок декодирования слов;
- A (Attention) — управление фокусом внимания чтения.
При этом модули выполняют следующие функции.
V (Visual) — визуальное оптическое распознавание текста
[править | править код]V (Visual) — оптическая нейросеть распознавания текста, считывающая текст как набор штрихов. Обычно буквы человеком не читаются полностью на нормальной скорости чтения, а иногда и не видны чётко при анализе текста в парафовеальной области глаза. V-сеть нейронов в координации с нейросетями следующих этапов позволяет нормальному человеку читать текст, даже если половину высоты букв закрыть маской горизонтально.
Как компьютерные эксперименты, так и натурные с человеком доказывают, что при чтении по целым словам отсутствует последовательный разбор букв. Все буквы, попавшие в зону жёлтого пятна, дешифруются параллельно. Как правило, у взрослого это 6—7 букв, а у 5—7-летнего ребёнка 3—4 буквы. Ещё около 7 букв V-сеть распознаёт очень приблизительно с большим количеством ошибок за счёт просмотра размытого изображения этих букв в парафовеальной области вокруг жёлтого пятна и передаёт эти неточные данные в нейросеть L1, которая, если сможет распознать за нечётким изображением букв высокочастотное слово, отдаст команду на пропуск его чтения. Общие размытые очертания текста периферическим зрением передаются в нейросеть M1 для общего планирования чтения страницы.[11]
M1 (Movement 1) — планирование саккад с возможностью их отмены по новым данным от L1
[править | править код]M1 (Movement 1) — нейросеть разработки плана чтения страницы с разработкой алгоритма из серии саккад. Использует размытое изображение всей страницы из периферической области глазного яблока, которая не может различать буквы в словах, однако если текст хорошо оформлен крупными заголовками, разными шрифтами, иллюстрациями, таблицами, то M1, опираясь на эти данные, выявляет, что читать на странице, и обеспечивает самое развитое скорочтение без потери смысла читаемого текста — обзорное или поверхностное. M1 также выполняет наведение глазного яблока на текущее слово и получает непосредственные команды от модуля предварительного орфографического разбора слова L1; в том числе важнейшее свойство M1 — это возможность отмены уже разработанного M1 алгоритма чтения следующих слов, если чтение текущего слова в L1 показало, что смысл текста требует изменений сценария чтения. Это в первую очередь перескок саккады через слово, которое, по данным L1, уже очевидно и не нуждается в наведении «жёлтого пятна» глаза для его чёткого прочтения.
M2 (Movement 2) — управление движением мышц глаза в саккаде без возможности отмены со стороны L1
[править | править код]M2 (Movement 2) — в модели E-Z Reader отдельно выделен этап программирования саккады глазного яблока, который экспериментально наблюдается и состоит в том, что на этапе M2 модуль L1 уже не может дать команду на отмену его перемещения. Как правило, M2 уже отдаёт команды мышцам глаза для начала движения и не может остановить этот процесс в середине, поэтому даже если глазное яблоко будет наведено ошибочно, перевод его в нужное положение будет обеспечен как обработка ошибки чтения (регрессия с возвратной саккадой).
L1 (Lexicon 1) — орфографический разбор слова и эвристики «знакомого слова» для саккад-пропусков слов
[править | править код]L1 (Lexicon 1) — в модели E-Z Reader учитывается крайне важный экспериментальный факт, что анализ слова состоит из двух раздельных этапов: предварительной оценки слова (L1) и извлечения слова из словаря (L2). Если глазу известно следующее слово, то L1 отдаёт команду M1 на перескок саккады. По этой причине в первых моделях E-Z Reader L1 назывался «тест на знакомое слово» (familiarity check). Последующие исследования показали, что в L1 имеется встроенный предварительный лексический разбор, который состоит в орфографическом разборе слова. Сам L1 не хранит словаря слов, за исключением словаря из 200—300 наиболее частотных слов и, главное, орфографического словаря из типовых комбинаций букв, которые можно уже дешифровать как группы правильно произнесённых фонем. У многих людей сам звуковой образ слова в L1 не формируется, а далее в L2 будет делаться поиск по словарю лексическим способом.
Важно понимать, что L1 имеет глубокую оптимизацию для планирования саккад. Команда на баллистический перескок на следующее слово будет отдана, даже если слово не дочитано, но эвристики L1 считают, что L2 способен дешифровать слово только по его части. Вторая оптимизация — это «парафовеальный предпросмотр». Закончив фазы L1 и L2, мозг, не сдвинув глазное яблоко, запускает снова L1 для размытого текста, видного в парафовеальной области вокруг «жёлтого пятна». Если L1 угадывает слово как узнаваемое, в первую очередь высокочастотное (например, предлоги), то L1 отдаст команду в M1 не только не наводить глаз для дочитывания текущего слова, но и пропустить следующее.
Дискуссионным является вопрос о том, что делает L1, если слово плохо распознаётся. Это могут быть как команды в M1 на повторное считывание (регрессия)[5], так и сообщение в L2, что качество распознавание орфографии получилось низким и следует формировать более широкие когорты и пытаться угадать слово семантическим способом. Возврат чтения из подсознания в сознание при неизвестных словах произойдёт далее в нейросетях I и A.
Исследования дислексиков показывают, что в рамках модели E-Z Reader в большинстве случаев самая распространённая фонематическая дислексия (80 % случаев дислексии) связана со сбоем в нейросети L1.[5] Причём многие такие дислексики могут быть вылечены, поскольку до использования моделей, подобных E-Z Reader, не было доказательств «врождённой грамотности» и тем более не было предположений о её связи с дислексией. Нейронные сети L1 у дислексиков могут быть обучены читать орфографию слов и формировать корректный звуковой образ слова через многократный прогон частотных слов с помощью специальных карточек (flashcards).
L2 (Lexicon 2) — определение слова по словарю когортным методом с семантическими эвристиками
[править | править код]L2 (Lexicon 2) — в модели E-Z Reader данный этап подразумевает поиск слова по словарю в мозге (lexicon access). Для поиска используются результаты орфографической дешифровки от этапа L1. При этом L1 не считывает слово полностью из-за ограничений глазного яблока и размера его чёткого зрения только в «жёлтом пятне», а делает разбор лишь первых 6—7 букв. Нейросеть L2, используя когортный метод поиска в словаре по первым буквам, отбирает слова-кандидаты, которые подходят под них. Это так называемая «когорта слов», то есть «отряд слов» по аналогии с основным смыслом слова «когорта». Далее лишние слова из когорты отбрасываются L2 за счёт работы семантического анализа слов и эвристик с предположениями, то есть L2 «домысливает» значение слова из общего контекста и очень часто «придумывает» окончания слов из грамматики языка чтения, так как для длинных слов «жёлтое пятно» не может разглядеть, чем слово кончается, а лишняя саккада для дочитывания слова сразу же в 2—3 раза снижает скорость чтения.
Дискуссионным среди учёных является вопрос, используется ли коннективистский метод извлечения слов из словаря на этапе L2. Модели коннективистских нейронных сетей представляют собой развитие отвергнутой учёными упрощённой модели «анализ через синтез», которая является базовой для объяснения чтения по буквам-фонемам и слогам. Наиболее вероятно, что в чтении целыми словами на уровне подсознания коннективистские нейронные сети не используются, так как для срабатывания им нужно чётко идентифицировать не только первый, но и ударный слог. В длинных словах ударный слог с его буквами оказывается за пределами угла зрения «жёлтого пятна», и дополнительной саккады на такой слог обычно не фиксируется. Иными словами, L2 базируется в основном на анализе от первых букв в угле зрения, то есть на когортном методе. По этой причине большинство реализаций E-Z Reader и его аналогов, таких как SWIFT, используют только когортную модель распознавания слов.[12]
I (Integration) — интеграция слов во фразы, выявление ошибок декодирования слов
[править | править код]Поскольку модули V и L2 делают множество эвристик с предположениями о том, какие буквы присутствуют в тексте, по всего лишь части их штрихов, а также домысливают слова по их частям, то возможны ошибки дешифровки текста. Примерно 4 % слов считываются ошибочно. Ошибки выявляет нейросеть I, которая выполняет дополнительный семантический анализ и, если очевидна ошибка, запускает считывание слова, повторно отдавая команды в M1 и L1 для возврата глазного яблока назад и чтения заново (регрессия). I-сеть также уточняет семантическое значение слова в общем контексте, поскольку умеет складывать несколько слов друг с другом и получать в итоге смысл фраз. Затем I-сеть отдаёт команды в A-модуль управлением вниманием.
A (Attention) — управление фокусом внимания чтения
[править | править код]A (Attention) — нейросеть управления фокусом внимания при чтения. Обычно управляется по командам из I-модуля на основе данных семантического анализа. Используются также данные по обзору текста периферическим зрением из M1.
Если по данным I-сети имеется полный сбой понимания семантики (значения) текста, то A-сеть может прекратить чтение по словам на уровне подсознания и вернуть чтение на уровень сознания. Однако, как правило, при таком возврате уже имеется звуковой образ слова, полученный из L1 по применению типовых правил орфографии. Следует отметить, что такой возврат может не происходить, когда у человека существует (или сформирована агрессивным фонематическим методом обучения через «фонематический слух») семантическая дислексия, то есть I-сеть игнорирует, что слова не распознаются по смыслу, а A-сеть принимает тот факт, что буквы читаются как звуки без понимания текста. Семантический дислексик с расстройством в I- и A-сетях читает текст примерно как музыкант читает ноты, то есть может быстро читать текст вслух, вообще не понимая, что читает, и не способен пересказать смысл прочитанного текста.
Примечания
[править | править код]- ↑ Erik D. Reichle, Keith Rayner, Alexander Pollatsek. [The E-Z reader model of eye-movement control in reading: comparisons to other models // The Behavioral and Brain Sciences. — August 2003. — Т. 26, вып. 4. — С. 445–476; discussion 477–526. — ISSN 0140-525X. Архивировано 23 июля 2018 года.
- ↑ Lyuba Mancheva, Erik D. Reichle, Benoît Lemaire, Sylviane Valdois, Jean Ecalle. An Analysis of Reading Skill Development using E-Z Reader // Journal of cognitive psychology (Hove, England). — 2015. — Т. 27, вып. 5. — С. 357–373. — ISSN 2044-5911. — doi:10.1080/20445911.2015.1024255.
- ↑ Keith Rayner. Eye Movements in Reading: Models and Data // Journal of eye movement research. — 2009-04-03. — Т. 2, вып. 5. — С. 1–10. — ISSN 1995-8692. Архивировано 12 ноября 2020 года.
- ↑ Anzhalika Dubasava. ДВИЖЕНИЯ ГЛАЗ ВО ВРЕМЯ ЧТЕНИЯ: От общих теорий к частным (англ.).
- ↑ 1 2 3 Stefan Hawelka, Benjamin Gagl, Heinz Wimmer. A dual-route perspective on eye movements of dyslexic readers // Cognition. — 2010-6. — Т. 115, вып. 3. — С. 367–379. — ISSN 0010-0277. — doi:10.1016/j.cognition.2009.11.004.
- ↑ Lesson Plan Sites: Elementary School (Grades 1-5) (англ.). www.angelo.edu. Дата обращения: 14 февраля 2018. Архивировано 14 февраля 2018 года.
- ↑ Texas Center for Learning Disabilities: Sight Word Fluency Lists (англ.). Texas Center for Learning Disabilities. Дата обращения: 14 февраля 2018. Архивировано 15 февраля 2018 года.
- ↑ Why Spritz Works: It's All About the Alignment of Words . spritzinc.com. Дата обращения: 14 февраля 2018. Архивировано 15 февраля 2018 года.
- ↑ 1 2 Testing an assumption of the E-Z Reader model of eye-movement control during reading: Using event-related potentials to examine the familiarity check . Дата обращения: 14 февраля 2018. Архивировано 21 декабря 2019 года.
- ↑ Figure 1. Schematic diagram of the E-Z Reader model of eye-movement... (англ.). ResearchGate. Дата обращения: 14 февраля 2018. Архивировано 14 февраля 2018 года.
- ↑ Keith Rayner, Timothy J. Slattery, Denis Drieghe, Simon P. Liversedge. Eye movements and word skipping during reading: Effects of word length and predictability // Journal of Experimental Psychology: Human Perception and Performance. — 2011-4. — Т. 37, вып. 2. — С. 514–528. — ISSN 0096-1523. — doi:10.1037/a0020990. Архивировано 3 октября 2019 года.
- ↑ Michael W. Eysenck, Mark T. Keane. Cognitive Psychology: A Student's Handbook. — Taylor & Francis, 2005. — 661 с. — ISBN 9781841693590. Архивировано 14 февраля 2018 года.