Inicio Noticias destacadas Por qué los datos extraen datos de PDFS es un sueño para...

Por qué los datos extraen datos de PDFS es un sueño para los profesionales de datos

34
0

Sin embargo, estas reclamaciones publicitarias no siempre son aplicables al rendimiento del mundo real, según ensayos recientes. «Por lo general, soy el mayor fanático de los modelos equivocados, pero el nuevo OCR específico de OCR que lanzaron la semana pasada ha actuado mal», dijo Willis.

«Envió a un colega Este BDF es Me preguntó si podía ayudarlo con la mesa «, dice Villis. Es un documento antiguo con una tabla con algunos elementos de diseño complejos. Nueva muestra específica de OCR (incorrecta) Desempeñó malRepita los nombres de las ciudades y active muchos números. «

El desarrollador de utilizadores de IA, Alexander Toria, señaló recientemente un defecto, con la capacidad de comprender la firma del falso OCR, Escribiendo«Lamentablemente, Mistral-Agrie tiene una maldición VLM regular: con manuscritos desafiantes, está completamente inconsciente».

Según Willis, Google lidera el campo en los modelos AI que actualmente leen documentos: “Ahora, para mí, el líder claro para mí Géminis 2.0 de Google Flash Pro Test. Esto es lo que Mistral no ha cometido con un pequeño número de errores, y he dirigido con éxito muchos PDF confundidos, incluidas personas con contenidos escritos a mano. «

El rendimiento de Gemini a menudo se origina en la capacidad de procesar documentos detallados (en un tipo de memoria a corto plazo llamada «Ventana de entorno), que se refiere a Villis como una ventaja importante:» Sus tamaños de ventana ambiental ayuda a cargar documentos grandes y trabajar a través de ellos «. Esta habilidad, en combinación con una manipulación muy fuerte del contenido hecho a mano, proporciona un margen de procedimiento que los competidores en el proceso de procesamiento del documento del mundo real.

Desventajas de OCR basado en LLM

A pesar de su promesa, LLMS presenta muchos problemas nuevos para el procesamiento de documentación. En ellos, pueden introducir confusión o ilusiones (información confiable pero falsa), seguir accidentalmente las instrucciones en el texto (piense que son parte de la línea de usuario) o generalmente malinterpretan los datos.

Source link

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí