Оказывается, в 1973 году уже делалась попытка составить аналогичный свод. см. URL. Статья Е.И. Бреусовой "Работа над усовершенствованием русской орфографии в 70-е годы (по материалам архива Российской Академии Наук)"
Газете "Комсомольская правда" дал интервью зам. председателя Орфографической комиссии РАН, доктор филологических наук Владимир Лопатин (23 мая 2000 г.) http://db.mupitt.penza.ru/news/news.phtml?day=2000-05-23&r_ cod=4 (Это дайджест, искать ОКЕЙ)
Тезисы интервью: Подготавливается новый "Свод правил русского правописания" взамен опубликованных в 1956 году "Правил русской орфографии и пунктуации". В новом Своде: - слова "брошюра" и "парашют" - с буквой "у" - сложные слова с первой частью "пол" все пишутся через дефис (сейчас "полмандарина" - слитно, а "пол-лимона", "пол-апельсина", "пол-яблока" через дефис. - "оффшор" - с одним "ф", как "офсайд" и "офис" - "риэлтор" - через "е", как "диета", "диез" - "пиар" - вместе - "окей" - вместе - "карате" - только с "е" - "бэтээры", "кавээнщики", а не "БТРы", "КВНщики" - "деланный", "считанный" - устранение удвоенного "н" - "ветреный" - с двумя "н" (как в "буквенный", "вахтенный", "болезненный") - "постельцинский" - с твердым знаком
В орфографический словарь включены слова "тусовка", "трахнуть", "накат" (жарг.) Вышел новый академический "Русский орфографический словарь" (в нем 160 тысяч слов), издательство "Азбуковник". Проект Свода еще будет обсуждаться. Жалко, не в Интернете, а в Отделении литературы и языка РАН. Утверждать будут Министерство образования и Академия наук. После опубликования Свода будет переходный период (два или три года), в течение которого старые написания не будут считаться ошибками.
Осторожно: подделка! Сейчас издается немало пиратских орфографических словарей, которые выдаются за новейшие. Вот два примера: Ожегов С.И. Орфографический словарь русского языка. В 2-х т. Сезам-маркетинг, 2000. Большой орфографический словарь русского языка: А-Я. ОНИКС, Альянс-В, 2000. На самом деле это точные копии устаревших изданий.
т.е. русский - самый лаконичный. что и понятно - суффиксное управление, отсутсвие артиклей, дифтонгов (и потребных для их передачи комбинаций из 2-3-... букв) - написал Дойч вместо Deutsch - и все дела
В свое время в радиоинституте по курсу передачи сообщений приводили данные по избыточности языков (т.е. превышение количества реально используемых букв над минимально необходимым согласно строгим статистическим исследованиям) русский - 2,48 Английский - 2,52 французский и немецкий - 2,54
>> Сергею Колинко. В переводе с английского implementation - выполнение (обязательств), проведение в жизнь, обеспечение. Тех, кто говорит и пишет "имплементация", надо лишать дипломов. Чтобы понять слово "ливанизация", надо въезжать в контекст, т.е. знать, что сотворили арабы в Ливане за последние 30 лет. Попробуйте сформулировать контекст для фразы, обращенной к моему сослуживцу-еврею, закоченевшему в нетопленом офисе (дело происходило в начале 80-х): "А ты такой замерзший, как Вайсберг в океане". >> Дм. Самойлову. Насчёт усложнения / упрощения языка согласен на 100%. >> Арнольду - про загрузку сайта. Ага, делал, помогает (а за давний совет насчёт прямой загрузки форума с паролем - спасибо!).
Дм.Самойлову - вдогонку Немного представляя, как работает скрипт-сервер Эха, дам совет. Если Вы видите, что в течение 15 секунд страница так и не загрузилась - жмите Esc ("Stop") - загрузка прервется - и Enter ("Refresh") - инициируйте новый запрос. Со второго-третьего раза форум, статья или интервью вылетят на экран как миленькие. Эффективность данного приема варьируется в зависимости от времени дня и качества связи, но в основном должно помочь.
Дм.Самойлову Я повторил Ваш опыт с Иоанном и пришел к тем же выводам. Могу высказать лишь одно предположение. Мне кажется, дело в самом характере текста. Чрезвычайно малый словарный запас, высокая конкретика (и обилие and, the) раздувают текст в английской редакции. Лемпель-Зив сбавляет разницу (с 15% до 3%), но не до упора. Доводя до логического конца исследование, публикую рейтинг зипованых Библий. Информация взята с сайта "The Unbound Bible" (см. URL). После рейтинг-числа проставлен размер зипа в МБ. Синодальный перевод занимает 12-е место, в аккурат между двумя английскими версиями :)
1. 1.04 Chinese Union Version (GB Encoding) 2. 1.06 Dutch Statenvertaling 3. 1.07 Chinese Union Version (Big 5 Encoding) 4. 1.19 Korean Version 5. 1.28 Bible in Basic English 6. 1.28 Norwegian Version 7. 1.31 Spanish Reina Valera 8. 1.31 Webster's Bible 9. 1.31 World English Bible 10. 1.32 Bulgarian Version 11. 1.32 King James Version 12. 1.32 Russian Version 13. 1.33 American Standard Version 14. 1.33 Portuguese Version 15. 1.36 Rumanian Version 16. 1.37 Darby's English Translation 17. 1.37 French Version (Louis Segond) 18. 1.37 Indonesian (Bahasa Indonesia Sehari-hari) 19. 1.37 Young's Literal Translation 20. 1.39 Indonesian (Terjemahan Baru) 21. 1.40 Albanian Version 22. 1.40 Icelandic Version 23. 1.40 Swedish Version 24. 1.42 Douay-Rheims Version 25. 1.42 Finnish Version 26. 1.42 German Version (Luther) 27. 1.43 Hungarian Version 28. 1.45 Indonesian (Terjemahan Lama) 29. 1.47 Cebuano Version 30. 1.49 Latin Vulgate Version (Jerome) 31. 1.56 Italian Version 32. 1.59 Serbo-Croatian Version
Неочевидность результатов только подчеркивает сложность любых лексических метрик.
Краткие ответы на вопросы: 1. Потому что техника стоит поганая, а заменить ее некому. Подробное техническое описание я уже давал (http://saturn.spaceports.com/~speakrus/f048.htm#7). Там все расписано со стороны поискового робота, но "на его месте может оказаться каждый". 2. У Лебедева постановка и реализация совершенно другие, отсюда и свист. 3. Вряд ли ЖК возымеет действие, здесь уместнее $50,000 ("не учите меня жить, лучше помогите материально").
Относительно языка чукчей то ли эскимосов. Правильно Вы не уверены в достоверности. Вероятно, это такая же байка, как и формализуемый язык индейцев и занзибарский язык. Но обычно она рассказывается по-другому. У них, мол, чуть ли не сотня слов для обозначения разных видов снега (типа наст, пороша, пурга, метель, сугроб), но отсутствует слово для общего понятия "снег". Как у нас нет слова "все, что мы видим вокруг". Эта байка рассказывается к вопросу об образовании общих понятий, о соотношении абстрактного и конкретного и т. п. материях. И есть другая байка, опять про индейцев. На этот раз у них оказывается около 50 слов для обозначения оттенков серого (а не белого, что, впрочем, одно и то же). Эту байку рассказывают физиологи для иллюстрации национальных различий органов чувств. У Вас получился гибрид из этих двух баек (приезжает муж из командировки, открывает шкаф, а там Петька с двумя порванными баянами), причем с расистским уклоном. Дескать, чукчи -- народ заведомо отсталый, язык, соответственно, богатый. А вот французы -- культурная нация: у них "ла неж" и точка (вернее, "блан" и точка). А вот пример с новоязом исключительно удачен, но показывает как раз обратное: в естественном состоянии язык стремится к новизне и разнообразию и, чтобы навязать ему упрощение, необходимо вмешательство минилюба (или как там у них это называлось). Это напоминает ситуацию у нас в издательстве. Синонимы у нас категорически запрещены. Ничто не вызывает в коллективе такого протеста, как этот запрет. Необходимость стандартизации терминологии вроде бы очевидна. Но всем нутром человек восстает против ограничения естественного права словотворчества, языковой игры (папильон, по классификации Фурье).
Признаться, я так толком и не понял, почему LZ-сжимаемость текста отражает сложность языка, но решил, пока суд да дело, к чему-нибудь это применить. Взял я все ту же «Лолиту» и зазиповал. Получилось следующее. Английский оригинал (626*) сжался до 265, русский перевод (689) -- до 321. Значит, -- подумал я, -- русский язык сложнее английского в примерно 1,2 раза. Странно, -- подумал я еще раз, -- мне казалось больше. Потом я взял одну из книг нашего издательства и проделал то же самое. Получилось: Английский оригинал: несжатый -- 272, сжатый -- 100. Русский перевод: несжатый -- 293, сжатый -- 118. Вот здорово, -- подумал я в третий раз, -- опять где-то 1,2. Тут я решил последовать совету автора идеи и зазиповал Евангелие от Иоанна. Тут меня ждала неожиданность. Русский текст оказался ощутимо короче английского: 85 против 100, а в зазипованном виде соответственно 31 против 32. То есть уже английский сложнее русского, хотя и ненамного -- в 1,03 раза. Что-то тут не то, Арнольд!
Натаче. Что такое usw?
диванову. Спасибо за замечательную новость номер 5.
------------------------------------------- * Все размеры в килобайтах.
PS.
Три вопроса без ответа
Почему все-таки этот сайт так погано работает? Почему у Артемия Лебедева, где вагон графики и всяких приятностей для глаза, все грузится со свистом, а здесь несколько строчек грузятся три часа и то не всегда? Может быть кто-нибудь возьмет на себя труд толково написать в ЖК, чтобы они надрали кой-чего этим икс-прожектерам?
Похоже, г-н Снегов в своих изысканиях пользовался чем-то вроде вордовского тезауруса. Не совсем ясно, что понимается под определением (это член предложения, а не часть речи), но если брать прилагательные, то можно без труда насчитать значительно больше десяти хвалебных: храбрый (смелый, отважный), умный (мудрый, талантливый, гениальный), добрый, щедрый (тароватый), красивый (прекрасный, пригожий), хороший (восхитительный, замечательный, великолепный), трудолюбивый (прилежный, старательный), сильный (могучий), самоотверженный, отзывчивый, душевный, внимательный...
Кроме того (тысяча извинений), выражение "в языке, как в капле воды" мне кажется неудачным. Можно сказать "в творчестве Н. А. Некрасова, как в капле воды, отразились страдания русского народа", т. е. это выражение подходит для случаев, когда что-то большое отражается в чем-то малом. В Вашем случае лучше было сказать "в языке, как в зеркале".