NLPx

Tales of Data Science

Тематическая сегментация: ARTM + TopicTiling

В предыдущем посте о возрождении блога я упомянул, что мы часть прошлого года отдали тематическому моделированию в виде ARTM + TopicTiling в попытках обеспечить качественную сегментацию текстов и выделение ключевых сегментов — что-то вроде необычной версии аннотирования/суммаризации текстов.

Я решил, что есть смысл чутка рассказать, а что это за штука, и с чем ее едят.

Выражаю благодарность Игорю Ляхову, который отдал часть своей жизни на изучение тематической сегментации.

Read More

272 просмотров всего, 8 просмотров сегодня

Итоги 2018 года: Data Science, NLP и все-все-все


Давненько ничего не писал здесь, хотя всякого интересного много есть.

Ниже расскажу, что же хорошего для науки и образования мы сделали в 2018 году.

Read More

3,986 просмотров всего, 4 просмотров сегодня