אלגוריתם יאהו חדש יכול לזהות התעללות מקוונת בהקשר, לא רק תוכן - מחשוב - 2019

Anonim

יש הרבה זבל באינטרנט, ולמרות שבני אדם לא יכולים לקבל את היכולת הרגשית לסרוק את כל זה, אלגוריתם חדש מיאהו עושה. זה נכון - איתור התעללות מקוונת פשוט נהיה הרבה יותר קל, והכל הודות ל"שיטה המבוססת על לימוד מכונה על מנת לזהות דיבור שנאה על תגובות משתמשים מקוונות ". המבטיח" להשגיח על תפיסת למידה מעמיקה של המדינה " אלגוריתם חדש זה יש את היכולת לזהות הודעות פוגעות עם סביב 90 אחוז קצב הדיוק.

איך הם עשו את זה? זה התחיל עם נתונים הרומן להגדיר יאהו בנה את עצמו, המורכב לחלוטין דברי שנאה או פוגע אחרת במאמר שצוין בעבר על ידי עורכי יאהו (כן, בני אדם). לאחר מכן, הצוות יישם תהליך המכונה "הטבעה מילה", אשר אפשרה להם לבחון מילים במיתרים. כלומר, גם אם מילה אחת אינה פוגעת ביסודה, האלגוריתם יכול לקבוע אם הביטוי המורכב ממילים אלה פוגע בסופו של דבר. זה שונה מרוב המערכות האחרות הזמינות, אשר בדרך כלל על המשמר של מילות מפתח, אבל עלול לפספס יותר מתוחכמים מסוג של דברי שטנה או תוכן פוגע.

"זיהוי אוטומטי של התעללות קשה באופן מפתיע", אומר החוקר אלכס קרסודומסקי-ג'ונס מהמרכז לבדיקת מדיה חברתית בבריטניה, שפורסם ב- MIT Technology Review. "שפה של התעללות היא אמורפי - משתנה לעתים תכופות ולעתים קרובות נעשה שימוש בדרכים שאינן מרמזות על התעללות, כגון כאשר מושגים גזעניים או מיניים מופקעים על ידי הקבוצות שפעם השמיצו".

הוא המשיך, "בהתחשב 10 tweets, קבוצה של בני אדם לעתים נדירות מסכימים על אילו מהם צריך להיות מסווג כפי פוגע, אז אתה יכול לדמיין כמה קשה זה יהיה עבור המחשב."

עם זאת, סיוע של מכונה בתהליך נראה כמו צעד מועיל לנוע קדימה, במיוחד בהתחשב בהיקף עצום של תוכן זמין כעת באינטרנט.