терапия
Сейчас этот блог в основном про психотерапию.
как правильно
Слушайте меня, я вас научу правильно жить.
психология
Буржуазная лже-наука, пытающаяся выявить закономерности в людях.
практика
Случаи и выводы из психотерапевтической практики.
кино
Фильмы и сериалы.
книги
Это как кино, но только на бумаге.
nutshells
«В двух словах», обо всем.
дорогой дневник
Записи из жизни (скорее всего, не интересные).
беллетристика
Мои литературные произведения и идеи.
духовный рост
Когда физический рост кончается, начинается этот.
дивинация
Как предсказывать будущее.
половой вопрос
Про секс и сексуальность.
магия
«Магическое — другое название психического».
Карл Юнг
игровой дизайн
Раньше я делал игры.
игры
Компьютерные игры.
язык
Лингвистические наблюдения.
людишки
Уменьшительно-ласкательно и с любовью.
культ личности
Про великих людей (то есть, в основном про меня).
религия
Опиум для народа
hwyd
Уникальная Система Прививания Привычек.
я
заяижопа
идеи
блоги
spectator.ru
дети
wow
вебдев
музыка
контент
программирование
дейтинг
диалоги
яндекс
кулинария
coub
fitness
символы
йога
шаманизм
tiny
backward2 forward3
 

Полуавтоматическое добавление тэгов

9 лет назад в категории вебдев

Полуавтоматическое добавление тэгов сделать можно. Но, конечно, совсем не так, как предлагает автор — по частоте. Например, слово тэги будет не самым частым в этом посте.

Там же в комментах умники заговорили про иерархию: «Одно из решений (не дающее 100% резульата). Создание каких-либо зависимостей или даже иерархии. Например для тегов водка, бухать, нажраться и пр. родительским тегом будет пьянка“. Однако это здорово усложняет систему и, как уже упомянул, сто процентного результата все равно не дает (плюс неясно как заполнять эти связи)».

Совершенно понятно, кстати, как связи заполнять.

Системе это, однако, не очень поможет. Ну а правильная расставлялка тэгов делается так: берем несколько корпусов текстов, проставляем им тэги вручную. После чего натравливаем на это байесовский фильтр, который обучается N раз, где N — количество тэгов.

То есть по аналогии с «это спам? Да/нет» — для чего байесовский фильтр часто и используется — обучаем его «это про кошечек? Да/нет».

Ну и надо помнить, что новые тэги такая система проставлять не будет, что хорошо. Ибо зачем нам тэг «Байес», например, этому посту? Нафиг не нужен до тех пор, пока это единственный пост с таким тэгом.

Да и вообще — тэги сосут.

0
Смотри также Еще в категории

ООПа

Так вот, от пхп в пятой версии уже не тошнит, все эти ООП-шные штучки используются не по назначению, но вполне по конвенциям для утаивания врагов режима сокрытия данных, организации библиотек и прочей ерунды. Ну, вы знаете. В результате синтаксис немного поменялся, а маразма стало много меньше.

«Бери и делай»

На фейсбуке недавно ввели нововведение (плеоназм!): интересы теперь представляют собой отдельные страницы/комьюнити/клубы — да хоть как назови, главное, что там люди будут тусоваться. Например, у меня появился интерес «гейм-дизайнер». Крутизну фичи понять легко: например, ты заполняешь в анкете интерес «замужем» и автоматически попадаешь в комьюнити замужних баб.

Удаление постов: как?

Задача: как сделать так, чтобы пользователи могли редактировать комментарий и при этом никого не травмировали. 1. Diff (ревизии и версии) не работает, честно. Он даже в вики не работает. Даже если бы он работал, никто не полезет сравнивать отредактированный комментарий с конечным.

Комментарии эскпертов

Зона .РФ станет хорошим подспорьем для малограмотных пользователей Рунета — в первую очередь, для рекламщиков, сотрудников телевидения и чиновников Министерства образования. источник Умри, а лучше не скажешь. Малограмотные пользователи Рунета. Чиновники Министерства образования, бомжи, деклассированные элементы.

Метки, тэги и AJAX

На проекте появились тэги, возможность подписки на новые ролики выбранных пользователей, в проекте применены AJAX-технологии. В новой версии проекта Видео@Mail.Ru существенно расширен функционал и улучшен пользовательский интерфейс. Появилась возможность использования тэгов, широко применены AJAX-технологии.

Тэги 2.0: сontribute or not!

В последнее время я работаю в Яндексе. Это такая интернет-компания, поэтому я время от времени думаю про всякие интернетовские вещи, типа вики, голосований или прочего. Некоторые из этих мыслей не дают Яндексу неоспоримое конкурентное преимущество, поэтому не подпадают по NDA, но делают мир лучше, поэтому грех не поделиться.

Голосование-2

Самое главное, о чем забыл написать подробно — подумал, что это и так очевидно: для чего нужно голосование, и что оно меряет. Голосование меряет только человеческий интерес. И всё. Те, кто думают, что голосованием можно измерять качество — в лучшем случае заблуждаются. Если будет анонимно голосовать одна и та же группа экспертов по всем работам, при этом никак с этими работами не связанная, — тогда может быть.