Yahooの不正使用検出アルゴリズムは90%の確率で機能し、この分野での大きな前進です

コンピュータアルゴリズムのヘルプ

Yahooのニュース記事には、インターネットの他の部分と同様に、不快なコメントがたくさんあるため、Yahooチームは、最悪の犯罪者を首尾よく特定できるアルゴリズムを開発するために、コメントセクションを使用することにしました。彼らの 新しい不正使用検出アルゴリズム 90%の確率で機能し、他の組織が同様の偉業を成し遂げようとする試みよりも効果的であり、この分野での大きな前進であると説明されています。 90パーセント しますか かなりいい音だと私は認めます。

有線 Yahooはまた、虐待と闘うためのプロジェクトの一環として、オンラインのヘイトスピーチの最初の公開されたキュレーションされたデータベースをリリースしていると報告しています。これは、他のサイトが独自のアルゴリズムを設計するためにYahooのコメントのデータベースを使用できることを意味します。 Yahooのアルゴリズムは、機械学習と、コメントセクションに関するユーザーからの報告データに基づいて開発されました。

コメントモデレートアルゴリズムの最も難しい部分は、誤検知の処理です。多くの不正使用検出アルゴリズムは、スラーや一般的な侮辱などの特定の単語やフレーズを探し、コメントにモデレートのフラグを自動的に付けます。ただし、これにより、コメントが適切ではないと言っている文脈でスラーに言及している場合や、コメントがトロールの皮肉な模倣である場合でも、コメントにフラグが付けられます。 Yahooのアルゴリズムは明らかに特定の音声パターンを検出でき、冗談の皮肉と実際の虐待の違いを識別できるように設計されています。 (もちろん、あなたの陽気なコメントが実際の悪用と見分けがつかない場合は、アルゴリズムがそれをフラグ付けすることは間違いありませんが、AIのその部分がどのように機能するかはわかりません。)

Yahooは、アルゴリズムを完成させるために訓練を受けたコメントモデレーターを雇いました。また、訓練を受けていないモデレーターにも支払いをしました。訓練を受けたモデレーターは、どのコメントが適切かを判断するのにはるかに優れていることがわかりました(簡単なことではありませんが、ちょっと)。 AIを作成する過程で、Yahooは、これらの訓練を受けた人間のモデレーターの作業が、アルゴリズムの有効性を維持し、その検出技術を完成させるために不可欠であることを発見しました。

もちろん、 アルゴリズムにはまだバイアスがあります 、コメントの分類に使用される方法論を繰り返し続けるには、(できれば多様な)人間のモデレーターのチームが必要になります。大変な仕事のように聞こえますが、少なくともYahooは、十分に訓練された人間のモデレーターと新しいAIの同僚の両方の役割を訓練し、評価することの重要性を理解しています。

働きたくないミーム

(経由 次のWeb 、画像経由 Michael Cordedda / Flickr )。