Tecnologia

iit madras: o corpo docente do IIT-Madras desenvolve modelos de IA para processar línguas indianas – Últimas notícias


Professores da Instituto Indiano de Tecnologia Madras (IIT-M) desenvolveram Inteligência artificial (AI) modelos e conjuntos de dados para processar textos em 11 línguas indianas, disse o principal instituto na terça-feira. A iniciativa foi lançada em conjunto com “AI4Bharat, “uma plataforma para a construção de soluções de IA para problemas de relevância para o país, disse um comunicado do IIT-M aqui.

A ferramenta de código aberto, totalmente gratuita, pode ser baixada em https://indicnlp.ai4bharat.org/ “Os modelos de IA multilíngue e conjuntos de dados desenvolvidos por meio desta iniciativa fornecerão os blocos de construção essenciais para alunos, professores, start-ups e indústria para trabalhar em ferramentas da língua indiana e expandir as fronteiras da tecnologia “, disse.


Pesquisadores de IIT Madras e a AI4Bharat lançou modelos de IA e conjuntos de dados para Tamil, Hindi, Malayalam, Telugu, Kannada, Punjabi, Bengali, Odia, Assamese, Gujarati e Marathi. De acordo com Mitesh M Khapra, professor assistente do Departamento de Ciência da Computação e Engenharia do IIT-M, conforme o país caminha em direção a uma economia digital, é importante que as línguas indianas encontrem um espaço online.

“Isso requer muita inovação na criação de ferramentas de entrada, conjuntos de dados e modelos de IA para idiomas indianos”, disse ele.

“Por exemplo, imagine um aluno que posta uma pergunta em uma plataforma de e-learning em Tamil ou Hindi ou qualquer outra língua regional da Índia. Há uma necessidade de ferramentas que possam processar automaticamente essas perguntas escritas em línguas indianas e classificá-las em específicas tópicos “, disse ele.

Essas ferramentas já estavam disponíveis para inglês e outras línguas estrangeiras, mas não para as indianas, acrescentou Khapra. AI4Bharat é uma iniciativa co-fundada por Khapra e Pratyush Kumar, Professor Assistente, Departamento de Ciência da Computação e Engenharia, IIT Madras e trabalha para resolver problemas específicos da Índia de forma aberta e voltada para a comunidade, acrescentou o comunicado.

Kumar disse que a iniciativa “é uma das poucas tentativas na academia” de desenvolver e lançar publicamente modelos de IA multilíngue em grande escala, contendo milhões de parâmetros treinados em bilhões de tokens de 11 línguas indianas, totalmente gratuitos e de código aberto.



Source link

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *