News (GL)

A nova xeración de intelixencia artificial Gemma 4 adopta a licenza Apache 2.0 en dispositivos locais

Gemma 4
Gemma 4 - Google

O xigante tecnolóxico responsable do buscador máis utilizado no mundo puxo á súa disposición unha nova familia de modelos de linguaxe de código aberto dirixidos a desenvolvedores e investigadores. A recente actualización trae ferramentas que admiten a entrada de texto, audio e imaxe, con ventás de contexto que alcanzan a marca de 256 mil tokens nas versións máis robustas. O principal diferenciador desta xeración é a eliminación das restricións comerciais anteriores, permitindo ás empresas utilizar a tecnoloxía con máis liberdade no seu propio hardware, desde servidores ata teléfonos móbiles.

Cambio nas pautas de uso comercial

A adopción dun novo formato de licenza elimina as barreiras que existían en versións anteriores da ferramenta. Os desenvolvedores agora teñen un maior control sobre os datos procesados ​​e as implementacións comerciais, sen necesidade de seguir políticas de uso prohibido que poderían ser actualizadas unilateralmente polo creador do sistema.

Este cambio estrutural pretende favorecer a creación de novos proxectos dentro da comunidade programadora. O enfoque na execución fóra de liña reforza a estratexia de ofrecer alternativas abertas e flexibles, permitindo que startups e grandes corporacións integren tecnoloxía sen custos recorrentes da interface de programación de aplicacións.

Avances técnicos no razoamento lóxico

Os novos sistemas presentan melloras substanciais na capacidade de resolver problemas matemáticos e seguir instrucións complexas. A arquitectura actualizada incorpora soporte nativo para chamadas de funcións e xera saída estruturada en formatos de datos específicos, o que optimiza o fluxo de traballo dos axentes autónomos.

A capacidade de procesamento do código de programación tamén sufriu perfeccionamentos para funcionar correctamente en ambientes sen conexión a Internet. O rendemento acadado nestas condicións achégase aos resultados obtidos polos servizos de intelixencia que dependen exclusivamente do procesamento na nube.

Tratamento multimodal da información

Ademais da tradicional interpretación de textos, a nova xeración procesa ficheiros de audio e imaxes de forma nativa. O sistema de recoñecemento de voz demostra unha precisión superior en comparación cos modelos lanzados o ano anterior, facilitando a transcrición e análise de comandos de voz en tempo real.

O soporte de entrada visual permítelle realizar tarefas avanzadas como o recoñecemento óptico de caracteres en documentos dixitalizados. A ferramenta tamén pode interpretar gráficos e táboas complexas, extraendo datos relevantes cun nivel de precisión que satisfaga as demandas do sector corporativo.

A combinación destas diferentes modalidades de entrada abre un abano de posibilidades para a creación de aplicacións interactivas. Os desenvolvedores poden estruturar solucións que analizan simultaneamente o que di o usuario e o que captura a cámara do dispositivo, procesándoo todo sen enviar os datos a servidores externos.

Variantes de tamaño e eficiencia

A familia de modelos dividiuse en catro configuracións principais para satisfacer as diferentes necesidades de hardware. As versións máis robustas, coñecidas como Mixture de Experts e Dense, están dirixidas a servidores de alto rendemento e estacións de traballo profesionais que xestionan un procesamento masivo de datos.

Por outra banda, as variantes máis lixeiras foron deseñadas especificamente para priorizar a eficiencia enerxética. Esses os modelos máis pequenos son ideais para funcionar no bordo da rede, é dicir, directamente no equipo dos usuarios finais, minimizando o consumo de batería e a necesidade de procesamento externo.

A versión experta baseada en arquitectura activa só unha fracción dos seus miles de millóns de parámetros durante o proceso de inferencia. O enfoque técnico Essa reduce drasticamente a latencia de resposta e o consumo de enerxía mantendo a capacidade de comprender e xerar textos en máis de cento corenta idiomas diferentes.

Os ficheiros completos cos pesos da rede neuronal están agora liberados ao público. Profissionais da área de tecnoloxía pode descargar inmediatamente o material en plataformas de hospedaxe de código recoñecida e repositorios centrados na aprendizaxe automática.

Optimización para dispositivos móbiles

O desenvolvemento das versións compactas realizouse en colaboración cos principais fabricantes de procesadores para dispositivos móbiles do mercado global. Essa A colaboración técnica deu como resultado sistemas capaces de ofrecer respostas cunha latencia practicamente nula en tarefas cotiás, como tradución simultánea e resumo de textos longos. As probas prácticas demostran que a tecnoloxía mantén un rendemento estable mesmo en placas de desenvolvemento de baixo custo e computadoras de placa única moi utilizadas en proxectos educativos e industriais.

Manter a eficiencia en diferentes configuracións de hardware representa unha ganancia práctica significativa para o ecosistema de aplicacións. Reducir o tempo de resposta no procesamento local é fundamental para os servizos que requiren un alto nivel de privacidade, como as aplicacións sanitarias e financeiras. Ao procesar a información directamente no dispositivo do usuario, a tecnoloxía elimina os riscos asociados á transmisión de datos sensibles a través de internet, garantindo que a información persoal permanece protexida contra a interceptación por parte de terceiros.

Integración co ecosistema de desenvolvemento

A dispoñibilidade inmediata de ferramentas nas plataformas oficiais facilita o acceso de investigadores e enxeñeiros de software ás novas tecnoloxías de intelixencia artificial. Os modelos de maior capacidade pódense probar e despregar a través de estudos de desenvolvemento na nube, mentres que as versións optimizadas para móbiles están en galerías dedicadas ao procesamento de punta. As empresas que buscan modernizar os seus sistemas internos poden integrar estas solucións nas súas infraestruturas locais sen preocuparse de pagar os custos mensuais polo uso de interfaces de terceiros. Ademais, a arquitectura das variantes máis lixeiras servirá de base fundamental para futuras actualizacións dos sistemas operativos móbiles, indicando unha clara tendencia de que a intelixencia artificial xerativa se converterá nun compoñente estándar e ubicuo nos teléfonos móbiles que chegará ao mercado nos próximos anos, transformando a forma en que os usuarios interactúan cos seus dispositivos a diario.

Ampliación do uso da intelixencia artificial aberta

A combinación de rendemento mellorado con licenzas permisivas amplía o abano de opcións para o sector tecnolóxico. O movemento cara a modelos de código aberto executables localmente reforza a independencia dos desenvolvedores e fomenta a creación dun entorno dixital máis diverso, onde a innovación non depende exclusivamente de grandes infraestruturas de computación en nube.

To Top