Reddit နဲ့ Google အကြား AI Data Sharing သဘောတူညီချက်အသစ် ညှိနှိုင်းမှုများ
Reddit Inc. က Alphabet Inc. ရဲ့ Google နဲ့ နောက်ထပ် content-sharing သဘောတူညီချက် ရယူဖို့ ကနဦး ဆွေးနွေးမှုတွေ လုပ်နေပါပြီ။ Reddit ရဲ့ data တွေက search result နဲ့ generative AI training မှာ အရေးပါတဲ့ အခန်းကဏ္ဍက ပါဝင်လာတာကြောင့် အနာဂတ် deal တွေကနေ တန်ဖိုးပိုရဖို့ ရည်ရွယ်နေပါတယ်။
Reddit ဟာ သူ့ရဲ့ ထူးခြားတဲ့ format ကြောင့် AI model တွေ train လုပ်ဖို့ အလွန်တန်ဖိုးရှိတဲ့ data source တစ်ခု ဖြစ်ပါတယ်။ Platform ပေါ်မှာ အမျိုးမျိုးသော niche topic တွေအကြောင်း အသုံးပြုသူတွေက အသေးစိတ် ဆွေးနွေးကြပြီး တကယ့်လူတွေရဲ့ အတွေ့အကြုံတွေ၊ အမြင်တွေကို မျှဝေကြပါတယ်။ ဒီ user-generated discussion တွေက AI တွေအတွက် လူသားတွေ ဘယ်လို စဉ်းစားလဲ၊ ဘယ်လို communicate လုပ်လဲဆိုတာ သင်ယူဖို့ အရမ်းကို အဖိုးတန်ပါတယ်။
Analytics company Profound AI ရဲ့ အချက်အလက်အရ Reddit ဟာ AI platform တွေမှာ အများဆုံး ကိုးကားခံရတဲ့ source တွေထဲက တစ်ခု ဆက်ဖြစ်နေပါတယ်။ ChatGPT ရော Google ရဲ့ AI assistant တွေပါ user တွေရဲ့ မေးခွန်းတွေကို ဖြေဆိုတဲ့အခါ Reddit thread တွေကို link အနေနဲ့ မကြာခဏ ထည့်သွင်းပြပေးလေ့ ရှိပါတယ်။
Google က ၂၀၂၄ ခုနှစ် ဇန်နဝါရီမှာ Reddit နဲ့ ပထမဆုံး data-sharing deal ကို ဒေါ်လာ သန်း ၆၀ နဲ့ ချုပ်ဆိုခဲ့ပါတယ်။ OpenAI ကလည်း အလားတူ သဘောတူညီချက် ရယူထားပါတယ်။ ဒီ deal နှစ်ခုအပါအဝင် Reddit က စုစုပေါင်း ဒေါ်လာ သန်း ၂၀၃ တန်ဖိုးရှိတဲ့ contract တွေကို နှစ် ၂ နှစ်ကနေ ၃ နှစ် သက်တမ်းနဲ့ ချုပ်ဆိုထားပါတယ်။
AI ကုမ္ပဏီတွေက Reddit data ကို ရဖို့ တရားဝင် licensing agreement တွေ ချုပ်ဆိုကြပေမယ့် အချို့ကုမ္ပဏီတွေက တရားမဝင် နည်းလမ်းတွေလည်း သုံးကြပါတယ်။ Reddit က OpenAI ရဲ့ ပြိုင်ဘက် Anthropic ကို သူတို့ရဲ့ data ကို ခွင့်ပြုချက်မရှိဘဲ scrape လုပ်ပြီး AI model တွေ train လုပ်တယ်လို့ စွပ်စွဲပြီး တရားစွဲထားပါတယ်။ Anthropic က မကြာသေးခင်က စာရေးဆရာအုပ်စုတစ်စုကို copyright ချိုးဖောက်မှုအတွက် အနည်းဆုံး ဒေါ်လာ ဘီလီယံ ၁.၅ လျော်ကြေးပေးဖို့ သဘောတူခဲ့ရပါတယ်။
အခု Reddit က Google နဲ့ ပိုမို နက်ရှိုင်းတဲ့ ပူးပေါင်းဆောင်ရွက်မှုအတွက် ဆွေးနွေးနေပါတယ်။ Dynamic pricing structure အသစ်မှာ Reddit က AI answer တွေအတွက် ပိုမို အရေးပါလာသလို ငွေပိုရနိုင်မှာ ဖြစ်ပါတယ်။ ဒါ့အပြင် Google traffic က Reddit user အသစ်တွေ တိုးလာအောင် လုပ်ပေးပြီး အဲဒီ user တွေက နောက်ပိုင်း AI training အတွက် content အသစ်တွေ ဖန်တီးပေးမယ့် win-win partnership မျိုး ဖြစ်လာဖို့ ရည်ရွယ်ထားပါတယ်။
"ကျွန်တော်တို့ data licensing deal တွေရဲ့ အလယ်လောက်မှာ ရှိနေပြီး လေ့လာနေဆဲပါ။ ဒါပေမယ့် Reddit data က အရမ်း ကိုးကားခံရပြီး တန်ဖိုးရှိတယ်ဆိုတာ တွေ့ရပါတယ်" လို့ Reddit COO Jen Wong က investor တွေကို ပြောခဲ့ပါတယ်။
Reddit ရဲ့ human-generated content တွေက AI development အတွက် မရှိမဖြစ် လိုအပ်တဲ့ training data ဖြစ်နေပြီး AI ကုမ္ပဏီတွေက ဒီ valuable resource ကို ရယူဖို့ ပိုက်ဆံအများကြီး ပေးဖို့ အဆင်သင့်ရှိနေကြတာ ပေါ်လွင်နေပါတယ်။
Discussion