+++ Об автоматически и речи нет +++ Ну вот такой предлагаю вариант (20 строк sql). На сайте с архивами висит развернутая акцентуированная парадигма (2.6 млн словоформ) http://www.speakrus.ru/dict/index.htm#paradigma 1. Текст (акцентуацию предварительно убрать) пословно парсится. Слова с "ё" заносятся в базу (unique констрейнт) в поле source_word 2. В соседнее поле simplified_word вносится то же source_word, но с заменой ё на е 3. Таблица сжимается по уникальным simplified_word, дубликаты убираем 4. В тексте подсвечиваются только те слова, которые найдутся среди simplified_word Плюсы: Туда с гарантией попадут все слова из перечня Вопрошательницы, их парадигма... и вообще все остальные слова из словаря Зализняка, в которых могут быть разночтения, это 90% любого литературного текста. Список можно пополнять. Минусы: не попадут туда имена собственные (Растелов/Растёлов, Петр/Пётр, Пчелов/Пчёлов) и редкие слова типа клёвый. Ленивый корректор будет, возможно, полностью полагаться на данный механизм, и рано или поздно он потеряет нюх. Если бы корректором был я, то я бы лично попросил это фичу отключить.
Об автоматически и речи нет! Но надо дать корректору в руки инструмент, облегчающий жизнь. Например, программа будет выделять в тексте все такие омографы, чтобы человек принял решение.
Просто оставить всё корректору невозможно, потому что уже многие вполне грамотные люди делают ошибки на Е/Ё. Там же лес тёмный! Почему акушЁр, но акушЕрка? Как это можно вывести разумом из закономерностей, которыми мы все пользуемся, когда говорим?
Один из моих ЖЖ-френдов поставил задачу: придумать алгоритм исправления Е на Ё в тексте. Не абстрактный, а чтобы книжку отредактировать.
Ему там разных накидали советов, но стопроцентного алгоритма что-то не получилось. Я предложила создать полный список всех слов и словоформ с Ё и с ним сверять. Но это огромная работа...
Хотя на филфаке и дурочки бывали... Но они тогда были молодые и милые, и им многое прощалось. И вода мокрее была. А теперь - и молодые и милые, но такие дуры...
НЕТ. Не проморгал. Настоящие выпускники самарского филфака Мишка и Саня помогли мне побить московскую пенсионную бюрократиху архивными документами и обеспечить полную сумму пенЬзии. А так бы год трудстажа украла молодуха.