Inteligencia Artificial
DeepSeek-OCR 2: Arquitectura Visual Causal Flow y codificador basado en LLM
DeepSeek-AI presenta DeepSeek-OCR 2, que incorpora DeepEncoder V2. Este modelo sustituye a CLIP por una arquitectura de lenguaje compacta que reorganiza los tokens visuales mediante un flujo causal, alcanzando un 91,09 % de precisión en OmniDocBench v1.5.