SenseTime apresenta o mais recente sistema de grandes modelos SenseNova 5.0

2024-04-28

SenseTime unveils latest large model SenseNova 5.0, full-stack large model matrix.jpeg

Xu Li, co-fundador e CEO da SenseTime. [Foto fornecida para chinadaily.com.cn]

A SenseTime, pioneira chinesa em inteligência artificial, apresentou seu sistema atualizado de grandes modelos SenseNova 5.0 e uma matriz completa de produtos baseados em grandes modelos "nuvem-borda-dispositivo" em seu evento Tech Day em 23 de abril.

"Na nossa busca por ampliar as capacidades do SenseNova, a SenseTime se mantém guiada pela Lei da Escala enquanto construímos nosso grande modelo com base nessa arquitetura de três níveis: conhecimento, raciocínio e execução", disse Xu Li, co-fundador e CEO da SenseTime.

Desde seu lançamento inicial, em abril do ano passado, o sistema de grandes modelos SenseNova da SenseTime lançou cinco iterações principais. Com base em mais de 10 TB de dados de treinamento de tokens e extensos dados sintéticos, o SenseNova 5.0 adota uma arquitetura híbrida desenvolvida por especialistas, com uma janela de contexto eficaz de até 200 mil para inferência. Esta atualização melhora principalmente as capacidades de conhecimento, matemática, raciocínio e codificação.

O SenseNova 5.0 demonstra melhorias nas capacidades de escrita criativa, raciocínio e sumarização para as áreas de humanidades. Com a injeção de conhecimento chinês, ele oferece melhor compreensão, sumarização e respostas a perguntas, oferecendo assistência para nichos como educação e indústrias de conteúdo, de acordo com a empresa.

No que diz respeito à ciência e tecnologia, o SenseNova 5.0 alcançou maior raciocínio quantitativo, habilidades de codificação e desempenho de raciocínio lógico, fornecendo serviços de suporte para finanças, análise de dados e outros domínios.

Um destaque são as capacidades multimodais do SenseNova 5.0, já que seu grande modelo multimodal ficou em primeiro lugar com base na pontuação agregada no benchmark de multimodalidade autoritativo MMBench, e obteve altas pontuações em outros rankings multimodais como MathVista, AI2D e ChartQA.

No nível de aplicação, o SenseNova 5.0 suporta análise de imagens longas de alta resolução, geração interativa de texto para imagem, extração de conhecimento complexo entre documentos, sumarização, exibição de perguntas e respostas, e interações multimodais ricas.

Observando as demandas de computação centralizada que se estendem aos dispositivos de borda e às necessidades de IA empresarial, a SenseTime introduziu uma matriz completa de produtos baseados em grandes modelos de borda. Isso inclui o SenseTime Edge-side Large Model para dispositivos terminais e o dispositivo de borda SenseTime Integrated Large Model (Enterprise).

O SenseNova Edge-side Large Language Model pode alcançar 18,3 palavras por segundo em plataformas de médio porte e 78,3 palavras por segundo em plataformas de ponta.

Testes também mostram que a velocidade de inferência da tecnologia de difusão de imagens LDM-AI de borda leva menos de 1,5 segundo em uma plataforma mainstream e suporta a saída de imagens de alta definição com resolução igual ou superior a 12 milhões de pixels, bem como funções de edição de imagem, como expansão proporcional, expansão livre e rotação de imagem.

O dispositivo de borda SenseTime Integrated Large Model (Enterprise) é introduzido para atender às crescentes necessidades de IA empresarial em finanças, codificação, saúde, governo e muito mais. O dispositivo realiza buscas aceleradas com apenas 50% de utilização da CPU e pode reduzir os custos de inferência em aproximadamente 80%, de acordo com dados da SenseTime.

A SenseTime também tem explorado as possibilidades de aplicações de grandes modelos e perspectivas em diversos domínios, incluindo software de escritório, finanças e transporte, com as principais empresas dessas indústrias, como Kingsoft Office, Haitong Securities e Xiaomi.

No encerramento do evento, foram apresentados três vídeos gerados pelo grande modelo, mostrando as conquistas da empresa na plataforma de texto para vídeo e apontando para o amplo potencial do grande modelo.

SenseTime unveils latest large model SenseNova 5.0, full-stack large model matrix2.jpeg

SenseTime revela o mais recente sistema de grandes modelos SenseNova 5.0, matriz completa de produtos de grandes modelos "nuvem-borda-dispositivo" em seu evento Tech Day em 23 de abril. [Foto fornecida para chinadaily.com.cn]