ПОХАПЭ
Смотрю движки основных форумов (потом расскажу, зачем).
...
Смерть, пиздец, жопа, убивать, убивать, убивать.
...
PHP-программисты бывают двух видов:
...
1. Те, кто не умеют программировать вообще. Специально для таких же был придуман BASIC. «Сделай инструмент для идиота, и только идиот захочет им пользоваться».
...
2. Те, кто умеют программировать на других языках. И только на них. Если утрировать, то когда ты узнаешь в PHP-коде привычный ассемблерный синтаксис, волосы в анусе становятся дыбом и седеют.
...
3. Болк.
...
Первые и вторые — дураки, просто вторые более изобретательные.
...
Ну, чтобы не быть голословным: при изобилии говна в таблицах — форум vBulletin создает всего-то чуть более сотни разных табличек, настройки форума они хранят в виде бинарной маски в цыфирке.
...
Причем в int(10), ага.
...
В чем профит-то? Место не экономится. Скорость выборки роли не играет. Работать с маской все равно придется, как со строкой, а не на побитовом уровне, decbin возвращает число в двоичной системе без ведущих нулей, и так далее.
...
(Мне тут уже подсказали, что это я на самом деле не умею работать с бинарными масками в PHP).
(еще 2 слова)
Полуавтоматическое добавление тэгов
Полуавтоматическое добавление тэгов сделать можно. Но, конечно, совсем не так, как предлагает автор — по частоте. Например, слово тэги будет не самым частым в этом посте.
...
Там же в комментах умники заговорили про иерархию: «Одно из решений (не дающее 100% резульата). Создание каких-либо зависимостей или даже иерархии. Например для тегов водка, бухать, нажраться и пр. родительским тегом будет „пьянка“. Однако это здорово усложняет систему и, как уже упомянул, сто процентного результата все равно не дает (плюс неясно как заполнять эти связи)».
...
Совершенно понятно, кстати, как связи заполнять.
...
Системе это, однако, не очень поможет. Ну а правильная расставлялка тэгов делается так: берем несколько корпусов текстов, проставляем им тэги вручную. После чего натравливаем на это байесовский фильтр, который обучается N раз, где N — количество тэгов.
...
То есть по аналогии с «это спам? Да/нет» — для чего байесовский фильтр часто и используется — обучаем его «это про кошечек? Да/нет».
...
Ну и надо помнить, что новые тэги такая система проставлять не будет, что хорошо. Ибо зачем нам тэг «Байес», например, этому посту? Нафиг не нужен до тех пор, пока это единственный пост с таким тэгом.
...
Да и вообще — тэги сосут.
(еще 13 слов)
Год и месяц
— Глебу все полтора года дают.
— Говори, что три, просто недоразвитый.
(еще )
Слова, на
Глеб пытается повторять за нами слова «блядь» и «пиздец».
...
Надо что-то с этим делать, пиздец, блядь.
(еще 4 слова)