Частотный анализатор текстов для изучения иностранного языка

Я благодарен Алексею Дубинскому за его программу http://dubinsky.nm.ru/wordstat.htm частотного анализа словаря текстов! Я попробовал ее и увидел, что "это то, что надо!". Умная программа, которая объединяет вариации одного слова в одно. Она имеет также другие удобные возможности. Кроме того, важно, что программа жива, - автор быстро и по делу откликается на внешние просьбы и предложения о развитии программы. Я бы сказал даже больше! Этот "подарок неба" может служить еще одним примером материализации (моей) мысли о том, что "вот такая программа мне позарез нужна" для выделения индивидуального языкового ядра, чтобы эффективнее вживаться в иняз.

К этому добавлю, что при работе с ядром языка, не забывайте, пожалуйста, о том, что Вам нужно ядро именно Вашего собственного языка. Использование частотных словарей "иняза-вообще" в этом смысле мало что дает.

В этом легко убедиться, если взять из частотного (сделанного кем-то) словаря какое-нибудь иняз-слово и посмотреть его перевод на родной "иняз". Скорее всего, Вы увидите не одно, а несколько значений, из которых лично для Вас окажется предпочтительным, - приятным, привычным, удобным, - какое-то одно из них.

Теперь проделайте обратную операцию, - посмотрите обратный перевод "вашего личного слова на родном языке" на иняз в соответствующем обратном словаре. Интересно узнать, какое из нескольких иняз-значений Вы выберите теперь? И совпадет ли оно с исходным иняз-словом?

Конечно, возможны случаи, когда при переводе "туда и обратно" слово имеет в словаре всего по одному значению. В этом случае однозначность равна единице. Вопрос ведь в том, каков процент таких однозначных слов? Слышал я как-то, что этот процент ничтожно мал... Так ли это? Кто знает?

Здесь можно сделать дополнительное замечание теоретического свойства об "облаках смыслов". Как говорил Игорь Юрьевич Шехтер "язык – это поток значений, а речь – это поток смыслов". Я уже не раз цитировал эту мысль Шехтера. Вдумайтесь!!

Язык – это поток слов, а речь – это поток смысловых облаков. Мы произносим слова, за которыми у нас спрятаны "облака смыслов". Эти облака у каждого из нас свои. Ни у кого больше в целом белом свете нет таких облаков! Мы подбираем к ним подходящие бирки-слова, произносим их (это и есть поток значений) и с помощью них пытаемся передать собеседнику наши облака-смыслы (это и есть поток смыслов). Так выглядит схема коммуникации человека с человеком.

Я, конечно, не проводил исследований о том, в какой степени совпадает индивидуальное языковое ядро отдельного человека с общеязыковым наиболее употребительным ядром иняза (сказать тут кстати, полученного на множестве слов, используемых носителями этого иняза как материнского). Это было бы интересно поисследовать и понять.

Но еще более интересно и полезно для дела вживания в иняз было бы понять, в какой степени перекрываются "общее ядро иняза" (эта самая "1000 наиболее употребительных слов"!) и "индивидуальное ядро" конкретного человека, имеющего другой материнский язык? Имея ответ на этот вопрос, можно было бы обосновано сказать, имеет ли смысл использовать в своих личных целях "ядро иняза-вообще" или нужно выделить свое собственное и работать именно с ним?

В связи с программой частотного анализа текстов Алексея Дубинского я нахожу очень интересной и полезной ссылку

"Начинающим изучать английский язык будет полезна следующая ссылка: http://1.harenet.ne.jp/~waring/Wordlists/vocfreq.html Список 1000+1000 самых употребимых слов в английском языке", которую прислал Alexandr Gerasimov

Было бы важно и, как нам кажется, очень полезным для эффективного вживания в иняз, совместить собственное комфортное языковое ядро в материнском языке с этим "употребимым" множеством слов в инязе. Для такого совмещения пока нет удобной программы (может быть, уже есть, но мне не известна). Поэтому придется проделать кое-какую работу вручную:

- с помощью программы А. Дубинского проанализировать свои тексты;

- вручную удалить из полученного списка неважные, - на Ваш взгляд, - слова;

- перевести оставшийся "ядерный личный словарь" на иняз с помощью обычного или е-словаря, выбирая при этом одно наиболее "приятное" или самое "важно" для себя значение в инязе;

- "наложить" полученный "личный иняз словарь" на выделенный кем-то массив наиболее употребимых (кем употребимых? ну, конечно, не Вами, а носителями иняза как родного, которые живут за тридевять земель совершенно в другом социальном и экономическом пространстве) слов.

- далее вживаться в иняз (тренировать его как иняз-спорт) на полученном пересечении двух множеств, - личного комфортного языкового ядра и иняз-частотного-вообще.

- освоившись в этом "минимальном" комфортном пространстве, постепенно приклеивать к нему, - путем соответствующих тренировочных упражнений, - дополнительные слова из личного и из инязовского наиболее употребительного множеств.

В этой связи большой интерес представляет сообщение, присланное Игорем Дудченко iranda@bigmir.net о том, что "в конце каждого из Лонгмановских (Longman ) словарей приведено 2000 самых употребительных английских слов, через которые объясняются все остальные в толковом словаре (а это тысяч 80). Налетай и пользуйся!"

Жаль, что нет ссылки на е-источник этих самых 2000!! Или, может, есть??!

Далее Игорь пишет: "Оговорки к применению - в каждом языке есть свои самые-самые употребительные слова, на которых держится остов языка. Так что слепо передрать все, например, на испанский не получится. Конечно, слов типа "зима", "поезд", "зеленый" в списке самых употребительных нет, но это правильно - такие понятия заучиваются легко и они однозначны.Однако остальные слова как раз и составляют те необходимые 1-2 тыс. слов для бытовых разговоров".

В этом смысле было бы интересно и для всех нас поучительно провести "общественный эксперимент" по сопоставлению собственного ядра языка с частотным иняз-ядром "иняза-вообще". При этом мы могли бы попутно получить ответ и на вопрос о том, насколько, - на самом деле!! - отличаются "мои личные иняз-ядра" в различных языках.

В рассылке "Парное обучение" http://subscribe.ru/archive/job.education.para/ мы начинаем публикацию серии материалов о тренировках для иняз-спортсменов. В них мы уделяем основное внимание практической стороне дела. Читайте!

Успехов! До новых "встреч в Эфире"! Всего Вам доброго, - Григорий Олегович.

При перепечатке ссылка на адрес Скорочтение обязательна.

Англоговорящие конференции

Публикую отзывы на вопрос, заданный в прошлом выпуске об англоговорящих интернет конференциях:

1. По поводу тупости забугорных собеседников:

Как говорится места надо знать. Если вы заходите на чат типа нашей кроватки, про знакомства и прочая то, что у них, что у нас, тупость стоит необыкновенная. Плюс языковой барьер, непонимание особенностей юмора, традиций и.т.д... Вот так и зреет в умах наших соотечественников мнение, что все буржуины недоумки. Не все... ;]

2. Я для погружения в среду предпочитаю все таки пользоваться не форумами, а чатами. Почему? Потому что ты сразу видишь реакцию на свои реплики, и можешь скорректировать дальнейшие. В конце концов вас никто не съест если вы спросите как правильно выразиться в том или ином

случае. Вот только аллах вас сохрани завалиться в немодерируемый веб-чат. Бардак и никакого толку я вам гарантирую.

3. Разумных бесед на интересующие вас темы советую искать на IRC каналах. Кто не знает, это сеть чатов для участия в которых нужно иметь специальный клиент, например mIRC.

Плюсы:

+ОГРОМНОЕ колличество чатов(многие тысячи), на ЛЮБЫЕ темы.

+Практически на всех каналах имеется модератор(или несколько) которыйвправе применить к любому такие очень полезными функции как Kick и Ban. Что как минимум заставляет держаться в рамках особо ретивых чатлан, ну а если не заставляет, то.... ;]

+mIRC очень гибкая программа, под себя можно настроить практически все, и если вы не поленитесь выучить основной набор комманд, то работа в ней будет быстрой и приятной...

+Вcё-таки, ИРК каналы не так доступны для просто интернетошатающихся. Чтобы попасть в ИРК сеть нужно как минимум знать о ее существовании.;]

+НЕзнаю насколько это можно считать плюсом, но есть чаты с гораздо более строгими правилами, а в некоторые и попасть то можно только по приглашению. Но и отсев кретинов там куда более жесткий...

MIM mim@mail.primorye.ru

Я пользуюсь листом рассылки Международной Гильдии Пиротехников- Pyrotechnic Mailing List. В нем общаются на различные околофейерверочныетемы пиротехники различных стран, и в первую очередь США.

Алексей Туркин, Московское Пиротехническое общество, lexa@school172.dnttm.ru

Найти ньюс-сервера с группами на других языках можно с помощью .newzbot.com. Если нужны группы, где почти нет "тупых" участников, подписывайтесь на эхи, начинающиеся со sci.*Аналогично для http://groups.yahoo.com

Статистический анализ текста

По адресу http://dubinsky.nm.ru/wordstat.htm находится программа "Wordstat" для статистического анализа текста (размер 180 Кб, можно сразу загрузить по ссылке http://alexd.virtualave.net/download/wordstat.exe ). Программа работает под Windows, позволяет выбрать файл и получить статистику - какие слова и сколько раз встретились в тексте.

Понимает текстовые и html-файлы, автоматически распознает кодировки windows и КОИ-8r. Предусмотрена возможность совместного подсчета словоформ - то есть слов в разном роде, падеже и пр. (объединяются похожие слова, которые имеют разное окончание). Есть возможность не учитывать слова, которые встретились только один раз. Программа распространяется как freeware, т.е бесплатно.

Надеюсь, что эта программа будет полезна читателям рассылки.

С наилучшими пожеланиями, http://dubinsky.nm.ru

Алексей Дубинский alexd2000@hotmail.com

Начинающим изучать английский язык будет полезна следующая ссылка:

http://1.harenet.ne.jp/~waring/Wordlists/vocfreq.html

Список 1000+1000 самых употребимых слов в английском языке. Отличительная особенность этой страницы - то, что здесь можно найти не только список основных слов, но и наиболее употребительные производные от этих слов.

Alexandr Gerasimov geran@rvcgns.chtts.ru

Другие статьи с сайта "Больше, чем скорочтение"


Разделы:Скорочтение - как читать быстрее | Java тренинги - работа на мобильном | Тест скорочтения - проверить скорость | Проговаривание слов и увеличение скорости чтения | Угол зрения - возможность научиться читать зиг-загом | Концентрация внимания - отключение посторонних шумов Медикаментозные усилители - как повысить концентрирующую способность мозга | Запоминание - Как читать, запоминать и не забывать | Курс скорочтения - для самых занятых | Статьи | Книги и программы для скачивания | Иностранный язык | Развитие памяти | Набор текстов десятью пальцами | Медикаментозное улучшение мозгов | Обратная связь