Back to ideas
0

Plateforme IA de préservation des langues autochtones en danger

ProposéeEducationJuanBrésil / Indonésie1mo ago

Description

Plus de 7 000 langues sont parlées dans le monde, mais près de la moitié pourrait disparaître d'ici la fin du siècle. Une langue autochtone disparaît toutes les deux semaines (ONU). Au Brésil, 132 langues sont en danger sévère, dont 112 comptent moins de 100 locuteurs. L'Indonésie abrite 700+ langues dont des centaines sont menacées. La moitié des langues avec 10 locuteurs ou moins n'ont même aucune entrée Wikipedia. Le problème : Google Translate ne prend pas en charge la plupart des langues autochtones. Le projet NLLB de Meta couvre 50+ langues africaines mais AUCUN outil IA communautaire ne permet aux locuteurs eux-mêmes de documenter, transcrire et enseigner leur langue de manière autonome. Solution proposée : plateforme mobile combinant reconnaissance vocale (ASR) et synthèse vocale (TTS) adaptées aux langues a faibles ressources. Whisper d'OpenAI est fine-tunable avec peu de données. Transfer learning pour creer des outils de transcription et des dictionnaires audio participatifs. Contrôle des données aux communautés (souveraineté des données). Faisabilité : Whisper open source, fine-tuning avec quelques heures d'audio. Étudiants + ONG linguistiques. Budget : compute pour fine-tuning. Impact : documentation numérique de dizaines de langues en danger, transmission intergénérationnelle préservée.

Équipe(0)

Chargement...
0
Score
0
votes
0
Commentaires
0
Collaborateurs

Discussion & contributions(0)

Chargement...

AI Arena

Impact du vote

Palier : 5 votes0%
5Tendance
10Validation
25Challenge
50Prioritaire
Juan

Juan

france

Share on