сам, и это бесконечно позитивно164 – при условии, что реальное (офф-
лайн) знакомство людей с их «вкусовыми» соседями не будет противо-
речить этике и принципу невмешательства в частную жизнь165.
Но в коллаборативных сервисах имеются и свои ограничения. К их
числу относится проблема нового пользователя. Чтобы дать ему точ-
ные рекомендации, системе прежде надлежит выяснить его предпоч-
тения. Это препятствие обходят, используя гибридный метод, совме-
щающий возможности контентного и коллаборативного принципов166.
Совсем недавно появились методики построения потребительского
профиля, в которых используется автоматическая обработка текстов
(data-mining), анализ сетевого поведения клиента и т. д. Они позволяют
учесть интересы и предпочтения пользователей, не обременяя их лиш-
ними вопросами, и тем самым насытить как их собственные профили, так и профили объектов. Эти технологии отчасти позволяют снять еще
одну проблему рекомендательных систем – назойливость (большин-
ство этих сервисов предполагают пользовательскую активность). Для
точного расчета необходимы оценки большого количества ранее оп-
робованных продуктов. Эти сведения стараются извлечь косвенными
методами167. Например, анализируют время, ушедшее на чтение ста-
тьи. Но косвенные данные неточны и не заменяют полностью прямых
оценок пользователя. Поэтому проблема снижения навязчивости ре-
комендательных систем при сохранении высокого качества их работы
164 Вообще говоря, сближение родственных по духу людей и формирование сооб-
ществ по интересам может оказаться главной ценностью коллаборативной тех-
нологии, радикально и позитивно меняющей мир.
165 Этика содействия организации обществ по интересам разбирается, в част-
ности, Тервином и Хиллом на примере системы PHOAKS. Главный приоритет
здесь – соблюдение невмешательства в частную жизнь (Terveen L., Hill W. Beyond Recommender Systems: Helping People Help Each Other // Carroll J. (ed.) HCI in the New Millennium. Addison-Wesley, 2001).
166 Подробнее см.: Rashid A. M., Albert I., Cosley D., Lam S. K., McNee S. M., Konstan J. A., Riedl J. Getting to Know You: Learning New User Preferences in Recommender Systems
// Proc. Intl Conf. Intelligent User Interfaces, 2002; Yu K., Schwaighofer A., Tresp V., Xu X., Kriegel H.-P. Probabilistic Memory-Based Collaborative Filtering // IEEE
Transactions on Knowledge and Data Engineering, Vol. 16, № 1, Jan. 2004. P. 56–69.
167 См.: Caglayan A., Snorrason M., Jacoby J., Mazzu J., Jones R., Kumar K. Learn Sesame
— A Learning Agent Engine // Applied Artifi cial Intelligence, Vol. 11, 1997. P. 393–412; Konstan J. A., Miller B. N., Maltz D., Herlocker J. L., Gordon L. R., Riedl J. GroupLens: Applying Collaborative Filtering to Usenet News // Comm. ACM, Vol. 40, № 3, 1997.
P. 77–87; Middleton S. E., Shadbolt N. R., de Roure D. C. Ontological User Profi ling in Recommender Systems // ACM Trans. Information Systems, Vol. 22, № 1, 2004. P. 54–88; Oard D. W., Kim J. Implicit Feedback for Recommender Systems // Proc. Recommender Systems. Papers from 1998 Workshop, Technical Report WS-98- 08, 1998.
187
ЧАСТЬ 2. УХУДШАЮЩИЙ ОТБОР В ИНДУСТРИЯХ КУЛЬТУРЫ
стоит довольно остро. MovieLens, например, первым делом просит но-
вичков проставить оценки двум десяткам фильмов168.
Те же сложности возникают и с новым товаром: его невозможно
рекомендовать до тех пор, пока он не наберет достаточного количества
оценок169.
Есть и еще одна препона – так называемая разреженность оценок.
Спрос на рекомендации обычно превышает наличие оценок в системе.
Люди предпочитают не давать оценки, а получать их, не вкладываться
в формирование базы данных, а пользоваться ею. Отсюда, в частнос-
ти, проблема «первого оценщика» и вообще «холодного старта». Как
