Na glasi zake za saini ya geeky na kichwa cha mtindo wa TED-mazungumzo, Sundar Photo alionekana moja kwa moja kutoka kwa incubator ya Bonde la Silicon.
Jumatatu hiyo, Februari 10, mtendaji mkuu wa Google alichukua hatua hiyo katika Mkutano wa Articial Articial Action Action huko Paris. Kutoka kwa Grand Palais Podium, alitangaza umri mpya wa dhahabu wa uvumbuzi.
“Kutumia mbinu za AI, tuliongeza zaidi ya lugha mpya 110 kwa Google Tafsiri mwaka jana, iliyozungumzwa na watu nusu bilioni kote ulimwenguni,” Tech Mogul, macho yake yalikuwa juu ya maelezo yake. “Hiyo inaleta jumla yetu kwa lugha 249, pamoja na lugha 60 za Kiafrika – zaidi zijazo.”
Iliyowasilishwa kwa monotone, taarifa yake ilisajiliwa kabisa kati ya wahudhuriaji wa mkutano huo – mkutano wa viongozi wa ulimwengu, watafiti, NGOs, na watendaji wa teknolojia.
Lakini kwa watetezi wa utofauti wa lugha katika akili ya bandia, maneno ya Mr. Phachai yalionyesha ushindi wa utulivu-moja ilifanikiwa baada ya miaka miwili ya mazungumzo makali, ya nyuma katika ulimwengu wa Arcane wa diplomasia ya dijiti.
“Inaonyesha ujumbe unaendelea na kampuni za teknolojia zinasikiliza,” alisema Joseph Nkalwo Ngoula, mshauri wa sera za dijiti katika UN Mission ya Shirika la Kimataifa la La Francophonie, New York.
Mgawanyiko wa lugha
Hotuba ya Mr. Pchai ilikuwa kilio mbali na makosa ya lugha ya AI ya mapema – tawi la akili bandia yenye uwezo wa kuunda yaliyomo asili, kutoka kwa maandishi hadi picha, muziki na uhuishaji.
Wakati OpenAI ilizindua Chatgpt mnamo 2022, wasemaji wasio wa Kiingereza waligundua haraka mapungufu yake.
Hoja kwa Kiingereza ingetoa majibu ya kina, ya kuelimisha. Haraka hiyo hiyo kwa Kifaransa? Aya mbili, ikifuatiwa na msamaha wa kondoo: “Samahani, sijapata mafunzo juu ya hilo,” au, “Mfano wangu haujasasishwa zaidi ya tarehe hii.”
Pengo kama hilo liko katika mechanics ngumu ya zana za AI, ambayo hutegemea kinachojulikana kama mifano kubwa ya lugha (LLMs) kama GPT-4, Meta's Llama, au Gemini ya Google kuchimba vijiti vikubwa vya data ya mtandao ambayo inawasaidia kuelewa na kutengeneza maandishi.
Lakini mtandao yenyewe ni mkubwa sana Anglophone. Wakati ni asilimia 20 tu ya idadi ya watu ulimwenguni wanaongea Kiingereza nyumbani, karibu nusu ya data ya mafunzo kwa mifano kuu ya AI iko kwa Kiingereza.
Hata leo, majibu ya Chatgpt kwa Kifaransa, Kireno, au Kihispania yameimarika lakini yanabaki chini kuliko wenzao wa Kiingereza.
Picha ya UN/Elma Okic
Umakini mkali
“Kiasi cha habari inayopatikana kwa Kiingereza ni kubwa zaidi, lakini pia ni zaidi ya hivi sasa,” Bwana Nkalwo Ngoula alisema. Kwa msingi, mifano ya AI inachukuliwa, kufunzwa, na kupelekwa kwa Kiingereza, na kuacha lugha zingine zinajitahidi kupata.
Mgawanyiko sio wa kiwango tu. AI, wakati wa kunyimwa mafunzo ya nguvu kwa lugha yoyote, huanza “hallucinate” – ikitoa majibu sahihi au ya upuuzi na mamlaka isiyo na wasiwasi – kama rafiki wa kujiamini kupita kiasi akipitia usiku wa trivia.
Matangazo ya kawaida ya AI yanajumuisha kujibu ombi la maelezo ya kibinadamu juu ya mtu maarufu kwa uvumbuzi wa Tuzo la Nobel au kuja na kazi isiyo ya kawaida, kama ilivyo katika mfano huu uliotengenezwa na Chatgpt, kwenye beest ya Habari za UN:
Habari za UN: 'Victor Hugo ni nani?'
Halluctinating AI: “Victor Hugo, mwandishi wa Ufaransa wa karne ya 19, pia alikuwa mwangalizi wa nyota ambaye alichangia muundo wa mapema wa Kituo cha Nafasi cha Kimataifa.” 🚀😆
Sanduku nyeusi
“Ni sanduku nyeusi inayochukua,” Bwana Nkalwo Ngoula alielezea. “Matokeo yanaweza kuwa madhubuti na yaliyopangwa kimantiki, lakini kwa kweli, yanaweza kuwa sahihi.”
Zaidi ya makosa ya kweli, AI huelekea kubatilisha utajiri wa lugha. Chatbots zinapambana na lafudhi za kikanda na tofauti za lugha, kama vile Quebecois French au lugha za Kireno zinazozungumzwa huko Haiti na Karibiani ya Ufaransa.
Mfaransa aliyetokana na AI-mara nyingi huhisi kusafishwa, kuvuliwa kwa nuances yake ya stylistic.
“Molière, Léopold Sédar Senghor, Aimé Césaire, Mongo Beti – wote wangekuwa wakigeuka kwenye makaburi yao ikiwa wangeona jinsi AI anavyoandika Kifaransa leo,” Bwana Nkalwo Ngoula.
Suala hilo linazidi zaidi katika nchi nyingi, kama ilivyo katika Kamerun ya asili ya mwanadiplomasia, ambapo vijana huzungumza kawaida Camfranglais – mseto wa Ufaransa, Kiingereza, Pidgin, na lugha za kawaida.
“Nina shaka vijana wanaweza kuuliza kitu cha AI huko Camfranglais na kupata majibu yenye maana,” alisema. Maneno kama “Je Yamo Ce analipa” (naipenda nchi hii) au “Réponds-Moi Sharp-mkali” (nijibu haraka) angeacha mifano ya AI ikashangaa.

Picha ya UN/Loey Felipe
Kampeni ya Kivuli cha La Francophonie
Shirika la Bwana Nkalwo Ngoula, La Francophonie – ambalo linakusanya pamoja majimbo 93 na serikali karibu na utumiaji wa Ufaransa, ikiwakilisha watu zaidi ya milioni 320 ulimwenguni – imefanya pengo hili la lugha kuwa kitovu cha mkakati wake wa dijiti.
Jaribio la kikundi hicho lilimalizika katika mwaka jana wa UN Global Digital Compact, mfumo wa utawala wa AI uliopitishwa na Nchi Wanachama. Kuanzia 2023 kuendelea, La Francophonie aliongeza mtandao wake wa kidiplomasia – pamoja na kikundi cha mabalozi wa Francophone katika UN – kuhakikisha utofauti wa lugha ukawa kanuni ya msingi katika utengenezaji wa sera za AI.
Njiani, washirika wasiotarajiwa waliibuka. Vikundi vya utetezi wa Lusophone na Rico vilijiunga na mapigano, na hata Washington waliunga mkono sababu yao. “Amerika ilitetea ujumuishaji wa lugha katika maendeleo ya AI,” Bwana Nkalwo Ngoula alisema.
Kushinikiza kwao kulipwa. Kompyuta ya mwisho ya dijiti ya ulimwengu inatambua wazi utofauti wa kitamaduni na lugha – suala ambalo hapo awali lilikuwa limezikwa chini ya majadiliano mapana juu ya kupatikana. “Lengo letu lilikuwa kuileta mbele,” alisema.
Harakati hiyo ilifikia Bonde la Silicon. Katika UN Mkutano wa siku zijazo Mnamo Septemba 2024, ambapo kompakt ilipitishwa rasmi, Sundar Pichai, Mkurugenzi Mtendaji wa Google, aliwashangaza wengi kwa kusisitiza hitaji la AI kutoa ufikiaji wa maarifa ya ulimwengu katika lugha nyingi.
“Tunafanya kazi kwa lugha 1,000 zilizozungumzwa zaidi ulimwenguni,” aliahidi – ahadi ambayo alithibitisha tena huko Paris miezi baadaye.
Mipaka ya kompakt ya dijiti ya ulimwengu
Pamoja na faida hizi, changamoto zinabaki. Mkuu kati yao ni kujulikana. “Yaliyomo ya Francophone mara nyingi huzikwa na algorithms ya jukwaa,” Bwana Nkalwo Ngoula anaonya.
Kutangaza kubwa kama Netflix, YouTube, na Spotify kutangaza umaarufu, inamaanisha yaliyomo ya lugha ya Kiingereza hutawala matokeo ya utaftaji.
“Ikiwa utofauti wa lugha ulizingatiwa kweli, mtumiaji anayezungumza Kifaransa anapaswa kuona filamu za lugha ya Kifaransa juu ya mapendekezo yao,” alisema.
Utawala mkubwa wa Kiingereza katika data ya mafunzo ya AI ni shida nyingine iliyotengwa na kompakt, ambayo pia huachilia kumbukumbu yoyote kwa UNESCOMkutano wa utofauti wa kitamaduni – usimamizi ambao, kulingana na Bwana Nkalwo Ngoula, unapaswa kurekebishwa.
“Tofauti za lugha lazima iwe uti wa mgongo wa utetezi wa dijiti kwa La Francophonie,” Nkalwo Ngoula alisisitiza.
Kwa kuzingatia kasi ya maendeleo ya AI, mabadiliko hayo hayawezi kuja hivi karibuni sana.