Pag-aaral ng Kaso: Pag-moderate ng Nilalaman

Habang patuloy na lumalaki ang paggamit ng social media, ang problema ng cyberbullying ay lumitaw bilang isang makabuluhang hadlang para sa mga platform na nagsusumikap na matiyak ang isang secure na online na espasyo. Isang nakakagulat na 38% ng mga indibidwal ang nakakaranas ng nakakapinsalang pag-uugali na ito araw-araw, na binibigyang-diin ang agarang pangangailangan para sa mapag-imbentong paraan ng pag-moderate ng nilalaman. Ang mga organisasyon ngayon ay umaasa sa paggamit ng artificial intelligence upang matugunan ang matagal na problema ng cyberbullying nang maagap.
Cybersecurity:
Inihayag ang Q4 Community Standards Enforcement Report ng Facebook – aksyon sa 6.3 milyong piraso ng nilalamang pambubully at panliligalig, na may proactive na rate ng pagtuklas na 49.9%
Edukasyon:
A 2021 natuklasan ng pag-aaral na 36.5%% ng mga mag-aaral sa Estados Unidos sa pagitan ng edad na 12 & 17 taon na nakaranas ng cyberbullying sa isang punto o iba pa sa panahon ng kanilang pag-aaral.
Ayon sa isang ulat noong 2020, ang pandaigdigang merkado ng mga solusyon sa pag-moderate ng nilalaman ay nagkakahalaga ng USD 4.07 bilyon noong 2019 at inaasahang aabot sa USD 11.94 bilyon sa 2027, na may CAGR na 14.7%.
Tunay na Solusyon sa Mundo
Data na nagmo-moderate ng mga pandaigdigang pag-uusap
Gumagawa ang kliyente ng isang matibay na modelo ng Machine Learning sa pag-moderate ng awtomatikong nilalaman para sa pag-aalok nito sa Cloud, kung saan naghahanap sila ng vendor na partikular sa domain na maaaring tumulong sa kanila sa tumpak na data ng pagsasanay.
Gamit ang aming malawak na kaalaman sa natural language processing (NLP), tinulungan namin ang kliyente sa pangangalap, pagkakategorya, at pag-annotate ng higit sa 30,000 dokumento sa English at Spanish para bumuo ng automated na content moderation Machine Learning Model na nahati sa Toxic, Mature, o Sexually Explicit na content mga kategorya.
problema
- Web scraping 30,000 mga dokumento sa parehong Espanyol at Ingles mula sa priyoridad na mga domain
- Pagkakategorya ng nakalap na nilalaman sa maikli, katamtaman, at mahabang mga segment
- Paglalagay ng label sa pinagsama-samang data bilang nakakalason, mature, o tahasang sekswal na nilalaman
- Tinitiyak ang mataas na kalidad na mga anotasyon na may minimum na 90% na katumpakan.
Solusyon
- Web Scrapped 30,000 mga dokumento bawat isa para sa Spanish at English mula sa BFSI, Healthcare, Manufacturing, Retail. Ang nilalaman ay higit na nahati sa maikli, katamtaman at mahabang mga dokumento
- Matagumpay na nilagyan ng label ang inuri na nilalaman bilang nakakalason, mature, o tahasang sekswal na nilalaman
- Upang makamit ang 90% na kalidad, nagpatupad si Shaip ng dalawang antas na proseso ng kontrol sa kalidad:
» Antas 1: Quality Assurance Check: 100% ng mga file na patunayan.
» Antas 2: Pagsusuri ng Kritikal na Kalidad: Ang Koponan ng CQA ng Shaips upang tasahin ang 15%-20% ng mga retrospective na sample.
Resulta
Nakatulong ang data ng pagsasanay sa pagbuo ng automated na content moderation na modelo ng ML na maaaring magbunga ng ilang mga resulta na kapaki-pakinabang para sa pagpapanatili ng isang mas ligtas na kapaligiran sa online. Ang ilan sa mga pangunahing kinalabasan ay kinabibilangan ng:
- Kahusayan sa pagproseso ng malawak na dami ng data
- Pagkakaayon sa pagtiyak ng pare-parehong pagpapatupad ng mga patakaran sa pagmo-moderate
- Scalability upang umangkop sa lumalaking base ng gumagamit at dami ng nilalaman
- Matutukoy ng Real-time na Moderation at
alisin ang potensyal na mapaminsalang nilalaman habang ito ay nabuo - Cost-effectiveness sa pamamagitan ng pagbabawas ng pagtitiwala sa mga human moderator
Pabilisin ang pag-develop ng iyong Conversational AI application ng 100%
Sabihin sa amin kung paano kami makakatulong sa iyong susunod na pagkukusa sa AI.