Hands-on mostra como utilizar ferramenta ORC e converter dados em estruturados

O treinamento, realizado no último dia 26 de junho, teve à frente Denys Farias e Rafael “Sexta”, engenheiros de software na Techvirtus

 

Uma tecnologia, que já é bem conhecida no Brasil por ser usada em radares para processar informações e identificar carros com documentação atrasada, foi tema de hands-on, no último dia 26 de junho. O encontro apresentou ao público as possibilidades oferecidas pela ferramenta OCR, que faz o reconhecimento de caracteres ópticos em imagens. De iniciativa do SoftexRecife juntamente com o Manguez.AL, Porto Digital, Assespro PE/PB e Seprope, a capacitação integra uma série de ações para difundir conhecimentos na área de Machine Learning e inteligência artificial no ecossistema de TIC local.

 

O treinamento teve à frente Denys Farias e Rafael “Sexta”, engenheiros de software na Techvirtus. Segundo Farias, o OCR identifica caracteres em documentos digitalizados ou fotografias com texto transformando esses dados em editáveis ou pesquisáveis (tanto para buscas simples como para as sofisticadas). Isto é, a ferramenta possibilita se converter as imagens em textos digitais. No curso, os palestrantes mostraram, de forma prática, como extrair e estruturar esses dados a partir de documentos escaneados.

 

Os participantes ainda tiveram que superar alguns desafios que são comuns ao dia a dia, a exemplo de dispor de PDFs com parte dos dados em texto. Então, para se chegar ao melhor resultado, o grupo decidiu converter todo o material em PDFs de imagem, padronizando a informação a ser tratada. “Nós propomos um fluxo de trabalho, no hands-on, que começou por transformar um PD F em imagem. Em seguida, enviar essa imagem para o Google Cloud Vision Api (serviço de OCR da Google). E, por fim, estruturar os dados obtidos por meio da ferramenta”, disse Farias. 

 

Ele explica que o Google Cloud Vision dispõe de modelos avançados de machine learning em uma API fácil de usar. Isso permitindo aos desenvolvedores entender melhor o conteúdo de imagens. A tecnologia é capaz não só de extrair palavras impressas contidas nas imagens, mas também de classificar as imagens em milhares de categorias, detectar objetos e rostos individuais. Os recursos dessa API hoje vêm sendo usados de várias maneiras, incluindo entretenimento e marketing.

Confira todos os informativos


Acompanhe nossa agenda de eventos, cursos e palestras!

Agendas de eventos

© SOFTEXRECIFE. Todos os direitos reservados.