Олег Макаренко (olegmakarenko.ru) wrote,
Олег Макаренко
olegmakarenko.ru

Измерить словарный запас

Сейчас внезапно наткнулся на одном закрытом форуме на очень любопытный факт: оказывается, в японском языке содержится меньше двух тысяч общеупотребительных иероглифов.

То есть, если вы потратите немного времени и выучите эти две тысячи символов, то вы сможете спокойно читать, например, японские газеты. Так как японские верстальщики не используют не входящие в этот список иероглифы.

(Update: тут с мест мне подсказывают, что выучить 2000 иероглифов будет недостаточно. Что же, пусть так. Сути поста это не меняет).

Перейдём теперь к более традиционным в наших широтах языкам. В русском языке приблизительно полмиллиона слов, в английском — около одного миллиона. А общеупотребительных слов в каждом из этих языков... ровно те же самые две-три тысячи.

Проще говоря, если вы знаете две тысячи английских слов, их будет достаточно, чтобы свободно читать и говорить без словарей. Или, точнее, овладев минимальным словарным запасом вы сможете вместо англо-русского словаря использовать толковый словарь.

Следующая ступень — словарный запас великих писателей, таких как Шекспир и Пушкин. Учёные подсчитали, что Шекспир использовал в своих пьесах 25 тысяч слов, Пушкин — 20 с хвостиком. При этом, как вы помните, Пушкин любил блеснуть каким-нибудь редким словцом, типа "цевница" или "аматёр".

Кстати, забавный факт. У нас очень силён миф о недоразвитости ругательств в английском языке. Дескать, известная школьникам пара четырёхбуквенных слов — это всё, чем могут похвастаться разносчики демократии.

На самом деле, конечно, если что англичане делать и умеют, так это материться. Например только для слова "гей" в английском языке есть не меньше нескольких десятков синонимов (пруфлинк). Как говорил Уинстон Черчилль, "плеть, ром и содомия — вот славные традиции Королевского Флота!".

Так вот. Какая у меня появилась идея по измерению словарного запаса.

1. Берём какой-нибудь большой толковый словарь типа вот этого (ссылка), на 180 тысяч слов.
2. Берём дополнительно какой-нибудь словарь среднего размера, на 18 тысяч слов, и в довесок, маленький словарь, на 1800 слов.
3. Делаем сайт с тестированием посетителей. По нажатию кнопки "измерить мой словарный запас" испытуемому выдаётся список из двадцати, скажем, слов, с вариантами значений. Типа вот такого:

Лайба — это
  (а) беспалубная парусная лодка;
  (б) плоский круг, вращающийся на оси;
  (в) лежачее толстое дерево;
  (г) цвет или краска.

4. Когда посетитель поотгадывает задачу, выдаём диагноз: "Вы знаете 20% редких слов, 70% малоиспользуемых слов, 100% общеупотребительных слов".


По трудозатратам, думаю, вряд ли создание такого сервиса займёт у программиста больше недели. А вещь будет весьма популярной. Особенно, полагаю, большим спросом будет пользоваться определение словарного запаса даже не в русском, а в английском, немецком и так далее языках.

PS: По поводу аналогичного теста, который гуляет по Интернету в разных ипостасях. Я его посмотрел. Тест хороший, но... это двадцатый век. Ручная работа. То есть, всего-навсего один вариант теста и, главное, никаких цифр в итоге. "Ваш словарный запас выше среднего" -- это не очень интересно узнать. Вот если бы написали "вы знаете 90 тысяч слов"... ну, вы поняли.
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 252 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →