Roman(tic) (infist_xxi) wrote,
Roman(tic)
infist_xxi

Чебурашка жив!

Не подумайте что тема с Чебурашкой, ищущим друзей загнулась... Нифига. Он (чебурашка) подбирает формулу похожести двух текстов и пока пришел к паре выводов:

- угол между многомерными векторами как мера похожести (нашел идею где-то на форуме), наверное, вещь прикольная, но к данной задаче неприменимая, или применимая с сильной доработкой напильником, потому что то, что она сейчас выдает (с некоторыми нормировками) иногда приводит в удивление. 

- будем считать метрики по частям речи... возможно, с коэффициентами. Типа существительное - характеризуюет контекст, прилагательные - восприятие этого контекста, а глаголы... с глаголами сложнее - их бы хорошо прогнать через какие-нибудь таксономии для "осмысления", а потом только использовать.

А сейчас
пора
спааааать!

Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 1 comment