Разработан алгоритм определения продажности сайтов

21.05.2009913

А вы в состоянии понять, что за сайт перед вами — чья-то личная страница или корпоративный проект, особенно если на нем расположена некая коммерческая информация? Специалисты в сфере IT из Индии и Японии утверждают, что нашли автоматический способ отличить чью-то персональную страничку от коммерческого сайта, сделанного с целью одурачивания потребителей.

Разработан алгоритм определения продажности сайтов

Такахиро Хаваши с коллегами из университета Ниигаты объясняют, что их метод извлекает субъективно воспринимаемые выражения, расположенные на вэб-странице. Затем система подсчитывает степень субъективности и выносит вердикт, выражает ли содержание страницы чье-то личное мнение или это такая маркетинговая уловка.

Ученые протестировали систему в работе, проанализировав 1200 страниц, тематически относящихся к четырем направлениям — конкретный товар, туризм, ресторан и кино. Выяснилось, что данный метод намного более эффективен для нахождения именно личных страниц, чем любой поисковик. А происходит это потому, что большинство популярных поисковых машин оценивает личные странички невысоко и они редко встречаются даже на первых десяти страницах результатов поиска.

Личные сайты, блоги и форумы расцениваются поисковиками, например Google или Яндекс, как личные странички, и как правило они никогда не займут места в первой десятке результатов поиска (SERPs). Именно чье-то личное мнение о том или ином продукте найти в интернете несравнимо труднее, чем коммерческие резюме и релизы.

Новая система основывается на том факте, что составители проплаченных сообщений чаще всего не употребляют критических или негативных отзывов о какой-либо продукции или услуге. Личные же мнения обычно пестрят и положительными, и негативными сообщениями.

В японском письменном это могут быть: выражения с негативной окраской, завершающие частицы, междометия и определенные символы — Кандзи — наподобие наших смайликов. Существуют эквивалентные выражения и на других языках.

Вот примерно такие выражения и извлекаются из текста страницы, а системный алгоритм разбирается, сколько из них положительных, а сколько отрицательных. Это и служит основным индикатором принадлежности страницы.

Подобный подход было бы неплохо применять в результатах поиска всех поисковиков, чтобы те, кому это важно, могли искать мнения потребителей, а не штампованные на заказ тексты.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

ИИ помогает неопытным таксистам работать наравне с профи
ИИ помогает неопытным таксистам работать наравне с профи

Таксисты в Японии случайно доказали, что&...

Как ИИ меняет бизнес и творческие профессии
Как ИИ меняет бизнес и творческие профессии

Споры о том, заменит ли ИИ люде...

Успешно испытан ИИ для диагностики кожных заболеваний
Успешно испытан ИИ для диагностики кожных заболеваний

Представьте инструмент, который замечает рак&n...

Квантовый компьютер смоделировал фундаментальные взаимодействия
Квантовый компьютер смоделировал фундаментальные взаимодействия

Квантовый компьютер Google впервые смоделирова

Глаза в облаках: как ИИ ставит диагноз по видео со смартфона
Глаза в облаках: как ИИ ставит диагноз по видео со смартфона

Искусственный интеллект учится распознавать бо...

Почему ИИ не чувствует мир, как человек
Почему ИИ не чувствует мир, как человек

Ученые объяснили, почему искусственный интелле...

Ученые выяснили, может ли ИИ создавать смешные мемы
Ученые выяснили, может ли ИИ создавать смешные мемы

Что будет, если поручить ИИ придумыв...

Доктор Айболит или доктор ИИ: кому доверяют пациенты
Доктор Айболит или доктор ИИ: кому доверяют пациенты

ИИ уже пишет истории болезней, но см...

Ученые выяснили, доверяют ли ИИ пациенты стоматолога
Ученые выяснили, доверяют ли ИИ пациенты стоматолога

Что чувствуете, когда вместо врача ваши снимки...

ИИ точно предсказывает рак груди по маммограмме
ИИ точно предсказывает рак груди по маммограмме

ИИ научился предсказывать рак по том

Геном как роман: нейросети стали лучшими читателями ДНК
Геном как роман: нейросети стали лучшими читателями ДНК

Что общего у стихов Пушкина и ДНК&nb...

Ученые улучшили распознавание животных на фото
Ученые улучшили распознавание животных на фото

Исследователи нашли способ заставить ИИ т...

ИИ нужен не забор, а поводок
ИИ нужен не забор, а поводок

Если регулировать ИИ как атомную ста...

Квантовые компьютеры станут меньше и экономичнее
Квантовые компьютеры станут меньше и экономичнее

Эксперты нашли способ укротить главного врага ...

Без вины виноватый: ИИ оправдывает свои поступки, как человек
Без вины виноватый: ИИ оправдывает свои поступки, как человек

ИИ, который оправдывает собственные пост...

Создан самый быстрый и надежный квантовый генератор случайных чисел
Создан самый быстрый и надежный квантовый генератор случайных чисел

Саудовские ученые создали генератор случайных

Ученые научили ИИ понимать иерархию клеток
Ученые научили ИИ понимать иерархию клеток

Ученые нашли способ заставить данные о&n...

ИИ определяет, какой принтер напечатал деталь
ИИ определяет, какой принтер напечатал деталь

Ученые создали ИИ, который по фотографии ...

Поиск на сайте

ТОП - Новости мира, инновации

Кости теряют связь: как остеоциты предают нас с возрастом
Кости теряют связь: как остеоциты предают нас с возрастом
ИИ помогает неопытным таксистам работать наравне с профи
ИИ помогает неопытным таксистам работать наравне с профи
Углеродные нанотрубки могут заменить медь в электромоторах
Углеродные нанотрубки могут заменить медь в электромоторах
Разработаны фотодиоды, которые видят быстрее и работают дольше
Разработаны фотодиоды, которые видят быстрее и работают дольше
Безвредные выбросы: микросхемы будут умирать красиво
Безвредные выбросы: микросхемы будут умирать красиво
Frontiers in Energy: Катализатор с 1.8% платины превзошел аналоги
Frontiers in Energy: Катализатор с 1.8% платины превзошел аналоги
Ученые разгадали тайну тихих вулканов
Ученые разгадали тайну тихих вулканов
Царство машин: однажды фабрики окончательно вычеркнут человека из процесса
Царство машин: однажды фабрики окончательно вычеркнут человека из процесса
Логистика на автопилоте: что тормозит беспилотные фуры
Логистика на автопилоте: что тормозит беспилотные фуры
Астрономы выяснили, почему в сердце Млечного Пути тоже есть молодые звезды
Астрономы выяснили, почему в сердце Млечного Пути тоже есть молодые звезды

Новости компаний, релизы

Бизнес в лаборатории: МИФИ научит студентов зарабатывать на науке
Биметаллические листы и плиты: в Петербурге построят новый завод
Инновации без розовых очков: что мешает России вырваться вперед
Надежда на технологии: инновации для реабилитации на форуме в Москве
Ловите вектор: как стать звездой научной лекции