лями, или стремление приобрести статус эксперта. Часто все, чего они
ждут – это благодарность за разъяснение, советы или провокационные
реакции.
2.7.3. Коллаборативные методы производства
рекомендаций
Системы коллаборативной фильтрации основываются на двух
принципах и, соответственно, бывают двух типов: анамнестические
(memory-based) и модельные (model-based)153.
Анамнестические алгоритмы продуцируют оценки клиента, исходя
из его предшествующих оценок154 и совокупности оценок, данных товару
другими пользователями. Это типичная поклиентская, или, иначе, субъ-
ект-субъектная схема коллаборативной фильтрации. Чтобы подсказки
были точны, нужно решить две задачи: отфильтровать качественных ре-
комендателей и резюмировать их оценки. Вкусовое подобие между кли-
ентами устанавливается на основании того, какие оценки они дали одним
и тем же товарам155. А вот вычисляться оно может либо корреляцион-
сланные аналитические материалы о продуктах.
153 Breese J. S., Heckerman D., Kadie C. Empirical Analysis of Predictive Algorithms for Collaborative Filtering //Proc. 14th Conf. Uncertainty in Artifi cial Intelligence, July 1998; Billsus D., Pazzani M. Learning Collaborative Information Filters // Proc. Intl Conf. Machine Learning, 1998.
154 Nakamura A., Abe N. Collaborative Filtering Using Weighted Majority Prediction Algorithms // Proc. 15th Intl Conf. Machine Learning, 1998; Delgado J., Ishii N. Memory-Based Weighted-Majority Prediction for Recommender Systems // Proc. ACM SIGIR’99
Workshop Recommender Systems: Algorithms and Evaluation, 1999; Resnick P., Iakovou N., Sushak M., Bergstrom P., Riedl J. GroupLens: An Open Architecture for Collaborative Filtering of Netnews // Proc. 1994 Computer Supported Cooperative Work Conf., 1994; Shardanand U., Maes P. Social Information Filtering: Algorithms for Automating «Word of Mouth» // Proc. Conf. Human Factors in Computing Systems, 1995.
155 В методе линейного сходства клиент и потенциальный рекомендатель представ-
ляются как два вектора m-мерного пространства, а сходство между ними опреде-
ляется по косинусу угла между двумя соответствующими векторами: где
– скалярное произведение двух векторов.
183
ЧАСТЬ 2. УХУДШАЮЩИЙ ОТБОР В ИНДУСТРИЯХ КУЛЬТУРЫ
ным методом (используется коэффициент корреляции Пирсона), либо
методом линейного сходства. Простейший способ измерения сходства
между пользователями – по среднеквадратичному отклонению.
Для улучшения работы системы используются различные модифи-
кации ранее описанных методов156. В частности, для преодоления де-
фицита оценок конкретного пользователя и подбора ему подходящих
рекомендателей прибегают к «голосованию по умолчанию» (эта схема
подходит в том случае, если все потребляют одно и то же и сходным об-
разом оценивают). Эмпирически установлено, что точность предсказа-
ния растет, если присваивать неоцененным товарам некую гипотети-
ческую оценку. Чтобы получить ее, предложено вычислять сходство не
между пользователями, а между товарами157.
Поскольку вкусы людей из группы рекомендателей, подобранных
компьютерной программой для данного клиента, хотя и близки между
собой, но все же не идентичны, нужно каким-то образом резюмиро-
вать их общую оценку. В примитивном варианте она вычисляется как
простое среднее. В то же время ясно, что чем более сходны во вкусах
клиент и кто-то из его рекомендателей, тем весомей должен быть вклад
оценки данного рекомендателя в предсказание, обобщающее мнение
группы. Однако и в этом варианте учтено не все: в частности, поль-
зователи по-разному воспринимают шкалу оценок. Эта проблема сни-
