Денис Баженов

Разработчик программного обеспечения. В данный момент специализируюсь в области извлечения информации, а также в области поисковых технологий. В этом блоге я веду заметки, связанные с моей профессиональной деятельностью.

Последние публикации

Классификация методом максимальной энтропии
23 Apr 2013

Наивный байесовский классификатор, о котором я уже писал, один из самых простых классификационных алгоритмов. В этой заметке я опишу более сложный алгоритм — метод максимальной энтропии, который, в ряде случаев, может оказаться существенно более точным. К своему удивлению, я не нашел в рунете более менее полного описания этого алгоритма классификации. Поэтому, считаю полезным поделиться этими знаниями.

Читать полностью »

Размер линейного счетчика
14 Apr 2013

Для использования линейного счетчика необходимо заранее знать приблизительное количество уникальных элементов в потоке. На основании этого количества, а также необходимого вам уровня точности, вычисляется длина битовой маски счетчика.

Читать полностью »

Архитектура поисковых систем
08 Jan 2013

Так уж получилось, что последние несколько лет я занимаюсь вопросами, связанными с поиском. Один из проектов, завершенных в прошлом году, был связан с модифицированием архитектуры нашей поисковой системы. В итоге мы получили результаты, которыми, как я считаю, имеет смысл поделиться. So, here we go.

Читать полностью »

Архив

Fair lock 17 Apr 2011
Lock vs. Lease 10 Aug 2010
About motivation 05 Jun 2010
KV-хранилища 16 Jan 2010
Interrupted Exception 04 Sep 2009
Pipelining 01 Aug 2009
Энди и Билл 19 Jul 2009
Fail Fast 15 Jul 2009
Groovy Remote Shell 23 Apr 2009
16x16 09 Jan 2009
ANTLR и DSL 18 Jun 2008
MySQL Queue 12 Jun 2008