Skip to main content

Определение алгоритма Twitter

Оценка сложности алгоритмов | Компьютерная школа Hillel (Май 2025)

Оценка сложности алгоритмов | Компьютерная школа Hillel (Май 2025)
Anonim

Умные люди в Твиттере собрали сложный алгоритм, чтобы их умные компьютеры знали, как «читать» трюки gazillion, которые они проталкивают через firehose.

Алгоритм, любой алгоритм, используется для обработки данных, часто помещая их в ведра, что даст окончательный вывод. Например, когда вы ищете что-то в Google или Bing, результаты поиска, которые вам возвращаются, исходят из алгоритма. Алгоритм поисковой системы определил, что то, что вы хотите, на основе вашего поиска, является тем, что они раскрывают вам.

Алгоритм Twitter, который читает и сортирует твиты, позволяет Twitter понять, что происходит в любом месте.

Например, когда Майкл Джексон умер, его смерть ознаменовала собой первый, затем два, затем четыре, а затем шесть из десяти трендовых тем в тот день. И это было за двадцать минут до того, как сообщила местная радиостанция.

В конце каждого года Twitter публикует страницу Golden Tweets, на которой отображаются самые переизданные твиты года. Это данные, которые они никогда не смогут проанализировать без специального алгоритма, предназначенного для подсчета этих ретвитов.

Когда Twitter впервые открыл новую вкладку Discover, они написали об алгоритме, используемом для ее создания:

«Мы начинаем развертывать новую версию вкладки« Discover », которая еще более персонализирована для вас. Мы улучшили наши алгоритмы персонализации, включив в нее несколько новых сигналов, включая учетные записи, за которыми вы следуете, и от кого они следуют. Все эти социальные данные используется для понимания ваших интересов и отображения историй, имеющих отношение к вам в реальном времени.

За кулисами новая вкладка Discover работает от технологии поиска в режиме реального времени от Earlybird, Twitter. Когда пользователь чирикает, этот текст индексируется и становится доступным для поиска в секундах. Каждый твит со ссылкой также проходит через некоторую дополнительную обработку: мы извлекаем и расширяем любые URL-адреса, доступные в твитах, а затем извлекаем содержимое этих URL-адресов с помощью SpiderDuck, нашего сборщика URL-адресов в реальном времени.

Чтобы генерировать истории, основанные на вашем социальном графике, и которые, по нашему мнению, вам наиболее интересны, мы сначала используем нашу библиотеку обработки графов Cassovary, чтобы определить ваши соединения и ранжировать их в соответствии с тем, насколько важны и важны эти соединения для вас.Когда у нас есть эта сеть, мы используем гибкую поисковую систему Twitter для поиска URL-адресов, которые были разделены этим кругом людей. Эти ссылки преобразуются в истории, которые будут отображаться вместе с другими историями на вкладке «Обнаружение». Перед тем, как отобразить их, окончательный рейтинг пройдет повторно, рассказывая о том, как много людей чирикают о них и насколько важны эти люди по отношению к вам. Все это происходит в почти реальном времени, что означает, что всплывающие и соответствующие истории появляются на новой вкладке Discover почти сразу, как только люди начинают говорить о них ».

Большинство компаний с алгоритмами обрабатывают тонны данных каждый день. Алгоритмы часто обновляются по мере необходимости. Например, за последние несколько лет Google обновил свой алгоритм поиска (до ужаса SEO везде) в тысячи раз. То, что вы получаете как результат поиска сегодня для любого заданного поиска, маловероятно для того, что вы нашли бы много лет назад.

Собственные поисковые алгоритмы Twitter также получили невероятную динамику. Вы можете найти людей, которые задают конкретный вопрос, кто использует смайлик в своих твиттерах, и людей, которые Tweeting специально в вашем географическом местоположении.

Алгоритм Twitter не должен быть столь же агрессивным, как у Google, но он, безусловно, надежный и эффективно используется для создания новых способов просмотра существующих данных Twitter.

Общие орфографические ошибки:

twitter algorythmалгоритм