Tecnologia

Revisão Temi |


De acordo com o site, o Temi é usado por mais de 10.000 clientes, incluindo ESPN e San Diego Union-Tribune.

A empresa por trás do Temi é afiliada a outra operação de transcrição Rev que usa humanos para processar áudio, mas esta solução usa aprendizado baseado em máquina para processar arquivos de forma rápida e barata.

Todos nós queremos áudio que seja transcrito a um custo perdido e com precisão, mas é isso que Temi está oferecendo?

Serviço de transcrição Temi

(Crédito da imagem: Temi)

Planos e preços

O modelo de preço do Temi é extremamente simples, sendo US $ 0,25 por minuto de gravação de áudio. Portanto, convém evitar o envio de um arquivo em que os primeiros dez minutos consistam em pessoas entrando na sala e ninguém dizendo nada significativo.

Embora o preço seja simples, ele não leva em consideração os usuários que podem mover grandes quantidades de conteúdo por meio da solução.

O que devemos mencionar é que o Temi agora está mais caro do que antes, já que há poucos anos ele cobrava apenas US $ 0,10 por minuto. Comparado com a transcrição manual, ainda é barato, mas outros podem oferecer serviços baseados em IA menos caros.

Serviço de transcrição Temi

(Crédito da imagem: Temi)

Projeto

O Temi tem um front end tão básico quanto é possível construir para este propósito. O site o orienta a fazer upload do arquivo e, em seguida, faz algumas perguntas simples sobre a qualidade do áudio, antes de prosseguir com o processamento do áudio em texto.

Quando o processamento for concluído, você será informado por e-mail, permitindo que você edite e analise a transcrição usando a interface da web do Temi.

A velocidade de transcrição é quase a metade do tempo de gravação, portanto, um clipe de áudio de 2 minutos leva cerca de um minuto para ser processado.

E isso é tudo que tem a ver com o Temi, já que não inclui a capacidade de avisar ao processador AI qual é o dialeto que ele está prestes a processar, e o único idioma que ele pode manipular é o inglês.

Serviço de transcrição Temi

(Crédito da imagem: Temi)

Os formatos de áudio suportados são mp3, mp4, m4a, aac e wav. E os arquivos de vídeo dos quais ele pode extrair o som incluem mp4, wma, mov e avi. Embora seja válido afirmar que esses arquivos de vídeo não são formatos, mas tecnicamente pacotes e, portanto, podem conter estruturas de áudio e vídeo que o Temi pode não entender.

E, pelo que entendemos, o Temi não consegue lidar com vídeo que contenha várias faixas de áudio.

Serviço de transcrição Temi

(Crédito da imagem: Temi)

Gravações

Assim que o arquivo for processado, você pode acessá-lo através do editor baseado na web, onde você pode ver imediatamente como Temi o interpretou.

Uma vez no editor, você pode mover o som e o texto da transcrição com eles sincronizados, e você pode fazer algumas edições, realçar e tocar palavras, se necessário.

Você também pode identificar o locutor para que, ao exportar a transcrição, ele nomeie corretamente os envolvidos.

Mas, além disso, há pouca funcionalidade para detalhar neste editor. E, acima disso, há uma página do Painel que lista os arquivos processados ​​como uma lista. O Dashboard não pode criar pastas ou rótulos para agrupar arquivos convertidos e foi projetado para lidar com apenas algumas dezenas de documentos ao mesmo tempo.

Os arquivos podem ser exportados como Word docx, PDF ou texto simples, ou como legendas em formato SRT ou VTT.

Ou, como alternativa, você pode compartilhar o acesso ao arquivo por meio de um link, que pode ser colocado em um e-mail ou distribuído nas redes sociais.

O que está faltando é uma conta de grupo onde vários usuários podem trabalhar em muitas transcrições ou coordenar seus esforços.

Serviço de transcrição Temi

(Crédito da imagem: Temi)

Precisão

Na melhor das hipóteses, o Temi é um sistema de transcrição decepcionante que não se restringe apenas ao inglês, mas também parece fortemente inclinado apenas ao inglês americano. Nossas tentativas de processar áudio de alta qualidade de nativos ingleses geraram um número significativo de imprecisões e erros ortográficos regionais.

O sistema também parecia não saber que os títulos são maiúsculos em inglês, assim como os nomes próprios, resultando em ‘mr’ e ‘mrs’. O modelo gramatical também não conseguiu estabelecer quando deveria usar ‘were’ ou ‘where’, ou outras palavras que soam iguais, mas requerem contexto para serem soletrados corretamente.

A rapidez com que o Temi processa o áudio é prejudicada pela quantidade de trabalho necessária para corrigir as falhas aparentes nas transcrições geradas. Esses erros são problemáticos para uma ferramenta de transcrição, a menos que a precisão da conversão seja de pouco interesse para você.

A empresa por trás deste produto entende suas limitações, e um link no site direciona os clientes ao site Rev afiliado que precisa de 99% de precisão.

Uma frustração é que você não pode ajudar ativamente o Temi a fazer um trabalho melhor corrigindo palavras repetidamente mal interpretadas ou criando uma biblioteca de nomes, termos técnicos ou abreviações.

Por causa disso, você pode descobrir que cada vez que edita um arquivo processado pelo Temi, está repetindo as mesmas correções de antes, o que pode se tornar rapidamente irritante.

Se você está procurando uma transcrição em que uma alta porcentagem do texto é precisa do que foi dito, provavelmente o Temi não é a ferramenta de que você precisa.

Serviço de transcrição Temi

Tudo sobre Temi é básico, incluindo o editor (Crédito da imagem: Temi)

Mobile Temi

Continuando com o tema das interfaces básicas, a versão móvel do Temi está disponível para dispositivos Apple iOS e Google Android. Uma vez instalado, o aplicativo móvel permite que o telefone ou tablet grave o áudio e envie-o diretamente para o processamento do Temi.

O software também permite o processamento de pagamento móvel, para que você possa pagar pela transcrição através do dispositivo.

Os recursos do aplicativo podem ser úteis para alguém que precisa gravar uma entrevista e fazer uma transcrição logo em seguida. Mas é preciso mencionar que tanto a Apple quanto o Google oferecem esta funcionalidade inerentemente em suas respectivas plataformas, a custo zero, para aqueles que desejam utilizá-la.

Veredicto final

Temi é uma solução relativamente barata, mas, neste caso, você obtém o que pagou.

Os responsáveis ​​por esse serviço prometem adicionar novos idiomas em breve para dar ao Temi um apelo mais amplo. No entanto, essas ambições ignoram a realidade de que a transcrição em inglês precisa ser mais precisa e capaz de lidar com as variações regionais.

O modelo atual só funciona de forma confiável com alto-falantes americanos e, mesmo com essa restrição, a precisão não é excepcional. Quando comparado com nomes como Happy Scribe, o Temi não entrega transcrições precisas de maneira eficiente, independentemente da qualidade de suas gravações.

O que aqueles por trás do Temi se esforçaram para criar é um sistema muito direto e não confundirá aqueles que o utilizam fazendo muitas perguntas. Mas sua simplicidade não permite que o usuário o ajude a fazer um trabalho melhor ou a construir um mecanismo de transcrição mais previsível.

Para aqueles com habilidades técnicas, o Temi tem uma API que pode permitir que os desenvolvedores de software acessem a direção do mecanismo de transcrição, e a integração do Zapier pode conectar contagens de negócios do Gmail, Dropbox e Google Drive como fontes para arquivos de áudio.

Portanto, se a precisão do Temi for boa o suficiente para seus objetivos e o preço aceitável, essa tecnologia pode ser aproveitada como parte de um processo de fluxo de trabalho.

Por mais útil que pareça, não estamos convencidos de que esta seja uma solução flexível o suficiente para todos os falantes de inglês para garantir o investimento de tempo e dinheiro para integrá-la aos sistemas existentes.



Source link

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *