3еместо

4

голоса

Статистическая и лингвистическая обработка

Здравствуйте! Очень интересный проект, особенно для лингвистов. Была бы ещё статистическая обработка, т.е. указание, сколько человек предложили данную ассоциацию, какова вообще её частотность. Я видела слова крупным шрифтом в словарных статьях, непонятно, то ли это самые первые ассоциации с этим словом, то ли самые частотные. Ещё не хватает лингвистического подхода. Это ведь не просто развлекательный проект, но в какой-то степени и научно важный, по нему можно воссоздать картину мира современного человека. А вообще мне как филологу интересно было бы узнать, каковы изначальные цели создания проекта, какое образование и мотивация у людей, которые работают над ним, каковы дальнейшие планы. Просто некоторые материалы можно использовать в исследованиях. Я была бы благодарна, если бы вы ответили на мои вопросы.

Екатерина, 18.12.2010, 06:08
Статус идеи: ожидает рассмотрения

Комментарии

sharky, 20.12.2010, 12:38
1. Размеры слов и словосочетаний в облаках определяют частоту. В выдуманных посетителями частоту предложения данной ассоциации. В остальных облаках частоту вхождений в устойчивых согласующихся по падежам, родам и числам конструкциях в проанализированных текстах.

2. Не исключено что можно, только непонятно куда эту картину потом вешать :)

3. Проект был побочным продуктом изучения подходов к автоматической классификации и сюжетированию текстов на натуральном языке для проекта inforotor.ru. В данном конкретном случае хотелось выделить и "пощупать" эти самые устойчивые согласующиеся конструкции.

4. Если что-то понадобится для исследований - пишите, поделимся.

Оставить комментарий