ФОРУМ "ГОВОРИМ ПО-РУССКИ"

Архив форума (#6564)
23.12.2010 17:26 - 24.12.2010 21:58
Предыдущий | На главную страницу | Вниз | Следующий

Арнольд Буквоедица
Самаритянин
Буквоедице Арнольд
Вопрошательнице Буквоедица
Сергей С
++полный список всех слов и словоформ с Ё и с ним сверять++ Вопрошательница
Более простое решение... Консультант
буква Ё Буквоедица
Самаритянин
Самаритянин
 
Буквоедица
24.12.2010 21:58:25
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Арнольд

Нужно в тексте без Ё расставить Ё, а не наоброт!


Самаритянин
24.12.2010 20:55:59
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 

Текст (акцентуацию предварительно убрать) пословно парсится. Слова с "ё" заносятся в базу (unique констрейнт) в поле source_word

Ой ё-моё! (с)Венедиктов мл.


Арнольд
24.12.2010 17:55:31
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Буквоедице
E-mail: arno1251@mail.ru

+++ Об автоматически и речи нет +++
Ну вот такой предлагаю вариант (20 строк sql). На сайте с архивами висит развернутая акцентуированная парадигма (2.6 млн словоформ)
http://www.speakrus.ru/dict/index.htm#paradigma
1. Текст (акцентуацию предварительно убрать) пословно парсится. Слова с "ё" заносятся в базу (unique констрейнт) в поле source_word
2. В соседнее поле simplified_word вносится то же source_word, но с заменой ё на е
3. Таблица сжимается по уникальным simplified_word, дубликаты убираем
4. В тексте подсвечиваются только те слова, которые найдутся среди simplified_word
Плюсы: Туда с гарантией попадут все слова из перечня Вопрошательницы, их парадигма... и вообще все остальные слова из словаря Зализняка, в которых могут быть разночтения, это 90% любого литературного текста. Список можно пополнять.
Минусы: не попадут туда имена собственные (Растелов/Растёлов, Петр/Пётр, Пчелов/Пчёлов) и редкие слова типа клёвый. Ленивый корректор будет, возможно, полностью полагаться на данный механизм, и рано или поздно он потеряет нюх. Если бы корректором был я, то я бы лично попросил это фичу отключить.


Буквоедица
24.12.2010 12:21:28
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Вопрошательнице

Об автоматически и речи нет! Но надо дать корректору в руки инструмент, облегчающий жизнь.
Например, программа будет выделять в тексте все такие омографы, чтобы человек принял решение.

Просто оставить всё корректору невозможно, потому что уже многие вполне грамотные люди делают ошибки на Е/Ё. Там же лес тёмный! Почему акушЁр, но акушЕрка? Как это можно вывести разумом из закономерностей, которыми мы все пользуемся, когда говорим?


Сергей С
24.12.2010 10:06:15
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 

А я вот стараюсь всегда писать "ё".
Со школы ещё, когда Ася Ионовна (учительница литературы) расказала, что Левин был Лёвиным.


Вопрошательница
24.12.2010 01:56:12
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: ++полный список всех слов и словоформ с Ё и с ним сверять++

Всё равно будут омографы (небо/нёбо, все/всё, ведро/вёдро, мел/мёл и пр.), автоматически не сделаешь. Не прикручивать же туда анализатор семантики...


Консультант
24.12.2010 00:17:43
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Более простое решение...

Отменить эту букву...точнее заменить ее этим - "йо"...


Буквоедица
23.12.2010 22:55:00
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: буква Ё

Один из моих ЖЖ-френдов поставил задачу: придумать алгоритм исправления Е на Ё в тексте. Не абстрактный, а чтобы книжку отредактировать.

Ему там разных накидали советов, но стопроцентного алгоритма что-то не получилось. Я предложила создать полный список всех слов и словоформ с Ё и с ним сверять. Но это огромная работа...


Самаритянин
23.12.2010 17:29:31
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 

Хотя на филфаке и дурочки бывали... Но они тогда были молодые и милые, и им многое прощалось. И вода мокрее была. А теперь - и молодые и милые, но такие дуры...


Самаритянин
23.12.2010 17:26:37
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 

НЕТ. Не проморгал. Настоящие выпускники самарского филфака Мишка и Саня помогли мне побить московскую пенсионную бюрократиху архивными документами и обеспечить полную сумму пенЬзии. А так бы год трудстажа украла молодуха.


Предыдущий | На главную страницу | Наверх | Следующий

Яndex
Google

TopList










Оформление (C) Арнольд