Ни одна система не является надежной, но есть вещи, которые могут помочь

В процессе создания, доставки и представления статей читателям всегда было задействовано больше людей, чем просто журналисты. Чтобы масштабировать, это необходимо.

В Flipboard мы доставляем более 100 000 историй в день - слишком много для того, чтобы даже армия редакторов могла обрабатывать, маркировать и представлять в соответствии с нашими ценностями, не говоря уже о том, чтобы это было индивидуально для каждого человека.

Здесь на помощь приходят алгоритмы. Их информируют редакторы, да, но правда в том, что их информирует любой, кто их касается. Алгоритмы разрабатываются людьми, и всякий раз, когда у вас есть люди, у вас всегда будет предвзятость.

От редактирования до разработки мы хорошо осведомлены об этой проблеме. Недостаточно иметь журналистские принципы, которых ты придерживаешься. Необходимо признать предвзятость и рассматривать ее как отдельную проблему. Вот несколько способов борьбы с предвзятостью при построении наших алгоритмов:

1. Ранжирование источников. Истина относительна, и невозможно преодолеть предвзятость, пытаясь дать ей определение. Вместо этого мы думаем о том, как мы можем использовать технологии для создания более контролируемой среды, оптимизированной для правды, но при этом позволяющей просвечивать множество перспектив. Для этого мы уделяем особое внимание доменам и издателям на Flipboard. Группа людей определяет редакционное качество источника (вот наше определение фальшивых новостей), а затем в игру вступает то, что называется индексатором домена . Система ранжирования, созданная для обнаружения спама, позволяет команде отдавать предпочтение источникам с известным послужным списком, которые сами следуют проверенным временем журналистским принципам. Кто и как оценивается, тщательно охраняется и постоянно проверяется.

2. Получение сигнала от как можно большего числа людей. Хотя средство ранжирования действительно усложняет отображение историй из "длиннохвостого" на Flipboard, есть еще один фильтр, который влияет на то, что вы видите: оценка удовлетворенности пользователей. Сочетание сигналов, которые показывают, насколько люди вовлечены в работу с частью контента, оценка является показателем качества. Любой предмет может быть добавлен в экосистему Flipboard, но затем он предстает перед жюри из читателей и кураторов, которые сами решают его судьбу. Статьи с более высокими оценками удовлетворенности, как правило, появляются на Flipboard чаще и в большем количестве мест, чем статьи с низкими оценками.

3. Признание предвзятости в наборах данных. Довольно часто набор данных уже смещен в сторону точки зрения большинства подмножества пользователей или всего общества (особенно общества США) в целом. На Flipboard большая часть контента, который мы обрабатываем, поступает от людей, которые перелистывают статьи в свои журналы - и поэтому, если есть дисбаланс по признаку пола или точки зрения, например, вы увидите, что это отразится на тенденциях в области контента на платформе. Это может создать петлю положительной обратной связи, поскольку решения «группы» могут подавлять и подавляют меньшинство.

4. Группировка историй для разных точек зрения. Поскольку мы являемся (независимым) домом для тысяч высококачественных издателей со всего мира, очень важно, чтобы мы раскрывали множество источников и мнений, которые вы здесь найдете. Кластеризация историй - это алгоритм, который мы используем для объединения историй из разных источников по одной и той же теме. Не каждый кластер на самом деле может иметь истории с действительно уникальными точками зрения - машинного обучения просто еще нет, но структура дает нам основу для обеспечения баланса.

5. Атрибуция для контекста. Все истории на Flipboard указаны автором, издателем и / или куратором, поэтому вы можете видеть, откуда они исходят, и принимать собственные обоснованные решения относительно врожденных предубеждений человека.

6. Найм для разнообразия. Во Flipboard около 14 000 тем, полученных с помощью алгоритмов; мы не можем проверить, насколько эффективен наш код при создании всех этих каналов, поэтому важно, чтобы мы проверили сечение этих каналов, а затем посмотрели на них с разных точек зрения. Это может стать проблемой в мире, где инженеры преимущественно мужчины. Мы не только должны учитывать гендерные предубеждения, но и наш продукт является глобальным, и мы начинаем применять наши алгоритмы не только к английскому, но и к другим языкам. Мы должны быть уверены, что разные люди осуществляют надзор, отражающий разные точки зрения. Важно, чтобы мы делали все возможное, чтобы получить как можно больше точек зрения по как можно большему разнообразию тем.

- Марти Роуз и Миа Квальярелло

Flipboard собирает мировые истории, чтобы вы могли сосредоточиться на том, чтобы инвестировать в себя, оставаться в курсе и участвовать. Благодаря тщательно подобранным пакетам, которые предлагают идеи и вдохновение для любого интереса, Flipboard заставит вас почувствовать, что вы хорошо провели время. Загрузите его из AppStore и Google Play Store и прочтите на flipboard.com.