Разработан алгоритм определения продажности сайтов

А вы в состоянии понять, что за сайт перед вами — чья-то личная страница или корпоративный проект, особенно если на нем расположена некая коммерческая информация? Специалисты в сфере IT из Индии и Японии утверждают, что нашли автоматический способ отличить чью-то персональную страничку от коммерческого сайта, сделанного с целью одурачивания потребителей.

Такахиро Хаваши с коллегами из университета Ниигаты объясняют, что их метод извлекает субъективно воспринимаемые выражения, расположенные на вэб-странице. Затем система подсчитывает степень субъективности и выносит вердикт, выражает ли содержание страницы чье-то личное мнение или это такая маркетинговая уловка.

Ученые протестировали систему в работе, проанализировав 1200 страниц, тематически относящихся к четырем направлениям — конкретный товар, туризм, ресторан и кино. Выяснилось, что данный метод намного более эффективен для нахождения именно личных страниц, чем любой поисковик. А происходит это потому, что большинство популярных поисковых машин оценивает личные странички невысоко и они редко встречаются даже на первых десяти страницах результатов поиска.

Личные сайты, блоги и форумы расцениваются поисковиками, например Google или Яндекс, как личные странички, и как правило они никогда не займут места в первой десятке результатов поиска (SERPs). Именно чье-то личное мнение о том или ином продукте найти в интернете несравнимо труднее, чем коммерческие резюме и релизы.

Новая система основывается на том факте, что составители проплаченных сообщений чаще всего не употребляют критических или негативных отзывов о какой-либо продукции или услуге. Личные же мнения обычно пестрят и положительными, и негативными сообщениями.

В японском письменном это могут быть: выражения с негативной окраской, завершающие частицы, междометия и определенные символы — Кандзи — наподобие наших смайликов. Существуют эквивалентные выражения и на других языках.

Вот примерно такие выражения и извлекаются из текста страницы, а системный алгоритм разбирается, сколько из них положительных, а сколько отрицательных. Это и служит основным индикатором принадлежности страницы.

Подобный подход было бы неплохо применять в результатах поиска всех поисковиков, чтобы те, кому это важно, могли искать мнения потребителей, а не штампованные на заказ тексты.

21.05.2009

Оценка:

Подписаться в Telegram



Net&IT

В МФТИ создали ПО для нефтяников и золотодобытчиков
В МФТИ создали ПО для нефтяников и золотодобытчиков

Сотрудники МФТИ предложили цифровое решение, к...

Студенты КНИТУ создали двуязычного ИИ-бота для туристов
Студенты КНИТУ создали двуязычного ИИ-бота для туристов

Студенты КНИТУ создали туристического бота с&n...

ACS Photonics: Разработаны улучшенные очки дополненной реальности
ACS Photonics: Разработаны улучшенные очки дополненной реальности

Дополненная реальность накладывает цифровые из...

FCS: Квантовые компьютеры ускоряют решение задач с матроидами
FCS: Квантовые компьютеры ускоряют решение задач с матроидами

Квантовые компьютеры работают быстрее классиче...

Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом
Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом

Генеративный искусственный интеллект часто оши...

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Использование прозвища бренда — не самая лучшая маркетинговая идея
Использование прозвища бренда — не самая лучшая маркетинговая идея
NatComm: Белки-шапероны помогают обычным белкам принять правильную форму
NatComm: Белки-шапероны помогают обычным белкам принять правильную форму
Cell Metabolism: Гены, отвечающие за риск диабета, делают клетки слабыми
Cell Metabolism: Гены, отвечающие за риск диабета, делают клетки слабыми
EMBO Reports: Разработан биологический подход для изучения паттернинга тканей
EMBO Reports: Разработан биологический подход для изучения паттернинга тканей
SciAdv: Состоялась первая успешная демонстрация двухмедийной NV-лазерной системы
SciAdv: Состоялась первая успешная демонстрация двухмедийной NV-лазерной системы
PNAS: Индивидуальный объем пожертвований в разовых акциях не меняется
PNAS: Индивидуальный объем пожертвований в разовых акциях не меняется
NatNeurosci: Стволовые клетки помогут увидеть развитие предвестников Паркинсона
NatNeurosci: Стволовые клетки помогут увидеть развитие предвестников Паркинсона
В СПбГУ установили причины извержения вулканов 100 миллионов лет назад
В СПбГУ установили причины извержения вулканов 100 миллионов лет назад
Lancet Digital Health: Приложение спасает молодежь из группы риска от депрессии
Lancet Digital Health: Приложение спасает молодежь из группы риска от депрессии
Система опреснения воды на солнечных батареях обеспечит дешевой питьевой водой
Система опреснения воды на солнечных батареях обеспечит дешевой питьевой водой
В ПНИПУ нашли способ сохранить данные после тестов высокотехнологичных изделий
В ПНИПУ нашли способ сохранить данные после тестов высокотехнологичных изделий
KSSTA: Детям с неправильно сформировавшимся коленом лучше избегать операции
KSSTA: Детям с неправильно сформировавшимся коленом лучше избегать операции
Почему Эмброс и Равкан получили Нобелевскую премию
Почему Эмброс и Равкан получили Нобелевскую премию
STE: Обработка собак от паразитов вредна для водной фауны
STE: Обработка собак от паразитов вредна для водной фауны
Journal of the National Cancer Institute: Лечение рака груди ускоряет старение
Journal of the National Cancer Institute: Лечение рака груди ускоряет старение

Новости компаний, релизы

Школьников зовут на олимпиаду по ядерным технологиям и квантовой физике
В СПбГУ откроется выставка «Наука в лицах»
Уникальный онлайн-курс по истории атомной отрасли создан в ядерном университете МИФИ
От Беларуси до Бразилии. О проектных стажировках Сеченовского Университета
Инженерный центр для дошкольников