DeepSeek quebra barreiras tecnológicas de IA e provoca agitação nas ações americanas

robot
Geração do resumo em andamento

A onda de IA varre o mundo, a DeepSeek surge de forma inesperada causando agitação no mercado

Recentemente, ocorreu um evento notável no campo da IA. Um grande modelo de IA chinês chamado DeepSeek superou pela primeira vez o ChatGPT em downloads na App Store dos EUA, alcançando o primeiro lugar. Este fenômeno não apenas atraiu a ampla atenção da comunidade tecnológica, de investidores e da mídia em todo o mundo, mas também gerou um breve sentimento de pânico no mercado de capitais dos EUA.

Como resultado, as ações de várias gigantes da tecnologia caíram em diferentes graus. A Nvidia caiu 5,3%, a ARM caiu 5,5%, a Broadcom caiu 4,9% e a TSMC caiu 4,5%. Outras empresas como Micron, AMD e Intel também apresentaram quedas correspondentes. Os futuros do Nasdaq 100 caíram para -400 pontos, podendo registrar a maior queda diária desde 18 de dezembro. Segundo estimativas incompletas, o valor de mercado da bolsa americana pode ter evaporado mais de 1 trilhão de dólares nas negociações de segunda-feira, o que equivale a um terço do valor total de mercado das criptomoedas.

O mercado de criptomoedas também não escapou desta onda de queda. O preço do Bitcoin caiu para menos de 100500 dólares, com uma queda de 4,48% em 24 horas. O Ethereum caiu para menos de 3200 dólares, com uma queda de 3,83% em 24 horas. Muitos investidores estão confusos com esta repentina volatilidade do mercado, e alguns acreditam que pode estar relacionado à diminuição das expectativas de cortes nas taxas de juros pelo Federal Reserve ou a outros fatores macroeconômicos.

DeepSeek está em alta, o mercado Crypto desabou?

A ascensão da DeepSeek levou as pessoas a repensarem os modelos de desenvolvimento de IA. Ao contrário de empresas como OpenAI e Meta, a DeepSeek não se desenvolveu com base em um forte capital e em muitos recursos de hardware. Em comparação, a OpenAI foi fundada há 10 anos, tem 4.500 funcionários e arrecadou 6,6 bilhões de dólares. Uma certa empresa de mídia social gastou 60 bilhões de dólares para desenvolver um centro de dados de IA do tamanho de Manhattan. A DeepSeek, por outro lado, foi fundada há menos de 2 anos, tem apenas 200 funcionários, um custo de desenvolvimento inferior a 10 milhões de dólares e não adquiriu muitos GPUs de alto desempenho.

Esta discrepância leva os profissionais da indústria a questionar: como os gigantes da tecnologia tradicionais podem competir com a DeepSeek? O sucesso da DeepSeek não só reflete as vantagens de custo em termos de capital e tecnologia, mas também desafia as concepções pré-existentes sobre o desenvolvimento da IA.

O vice-presidente de produtos de uma conhecida empresa de tecnologia comentou nas redes sociais que a história do DeepSeek exemplifica uma inovação disruptiva típica. As empresas existentes estão a otimizar processos existentes, enquanto os disruptores estão a repensar abordagens fundamentais. O DeepSeek propôs uma nova ideia: e se fizermos isso de forma mais inteligente, em vez de simplesmente investir em mais hardware, qual seria a diferença?

Atualmente, o custo para treinar modelos de IA de ponta é extremamente elevado. Algumas empresas líderes em IA gastam mais de 100 milhões de dólares apenas em computação, necessitando de grandes data centers equipados com milhares de GPUs no valor de 40 mil dólares cada. No entanto, a DeepSeek propôs uma solução surpreendente: concluir essa tarefa com 5 milhões de dólares. Mais impressionante ainda é que eles não apenas apresentaram essa ideia, mas realmente a realizaram. Seus modelos são comparáveis ou até superiores aos sistemas de IA líderes do setor em várias tarefas.

O sucesso da DeepSeek vem da sua reavaliação de tudo a partir do zero. Modelos de IA tradicionais usam números de ponto flutuante de 32 bits para representar cada número, enquanto a DeepSeek tenta usar números de ponto flutuante de 8 bits, descobrindo que a precisão ainda é suficiente. Essa mudança reduziu a memória necessária em 75%. Como resultado, o custo de treinamento caiu de 100 milhões de dólares para 5 milhões de dólares, a quantidade de GPUs necessárias caiu de 100.000 para 2.000, e o custo da API foi reduzido em 95%. Mais importante ainda, o modelo deles pode ser executado em GPUs de jogos comuns, sem a necessidade de hardware especializado de data center.

O sucesso da DeepSeek desafiou várias concepções tradicionais no campo da IA, incluindo a ideia de que a China só pode fazer código-fonte fechado, a posição de liderança absoluta do Vale do Silício no campo da IA e que o desenvolvimento de modelos de IA de topo requer investimentos enormes. Essas visões, mesmo que não tenham sido completamente derrubadas, foram seriamente abaladas.

Uma conhecida instituição de investimento em private equity nos Estados Unidos comentou em seu briefing sobre o DeepSeek, destacando que isso representa uma vitória do código aberto em relação ao código fechado. As contribuições da comunidade de código aberto podem ser rapidamente convertidas em prosperidade para todo o ecossistema. Ao mesmo tempo, eles também acreditam que, embora o caminho de desenvolvimento das empresas de IA tradicionais pareça simples e brutal, não se pode descartar a possibilidade de uma nova transformação qualitativa após alcançar um certo tamanho. Olhando para a história do desenvolvimento da IA nos últimos 70 anos, a capacidade de computação continua a ser de extrema importância, e esse ponto pode ainda se aplicar no futuro.

A chegada do DeepSeek elevou os modelos de código aberto a um nível comparável aos modelos de código fechado, e até mesmo superou-os em eficiência. Isso reduziu a necessidade das empresas de adquirirem APIs de IA comerciais, proporcionando maior espaço para o desenvolvimento de aplicações a jusante. Espera-se que, nos próximos um a dois anos, testemunhemos uma gama mais rica de produtos de chips de inferência e um ecossistema de aplicações de grandes modelos de linguagem mais próspero.

Apesar de o DeepSeek demonstrar uma eficiência muito alta, os especialistas acreditam que a demanda por poder de computação não diminuirá. Isso está de acordo com o paradoxo de Jevons na economia, onde o aumento da eficiência tecnológica leva a um aumento no consumo total de recursos. Assim como no processo de popularização dos telefones Nokia a partir dos grandes telefones, foi exatamente a redução de custos que possibilitou a popularização, e essa popularização levou a um aumento no consumo total do mercado.

Este grande avanço na tecnologia de IA sem dúvida terá um impacto profundo no panorama tecnológico global e oferece novas ideias para a futura direção do desenvolvimento da IA. À medida que a tecnologia continua a evoluir, esperamos ver mais inovações e avanços, impulsionando o campo da IA em direção a uma maior eficiência e disseminação.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • Compartilhar
Comentário
0/400
ContractFreelancervip
· 11h atrás
GPT esta condenado
Ver originalResponder0
LuckyBlindCatvip
· 11h atrás
Atingiu o ponto sensível das grandes empresas.
Ver originalResponder0
WhaleStalkervip
· 11h atrás
Código aberto é o verdadeiro caminho!
Ver originalResponder0
BankruptcyArtistvip
· 11h atrás
Mais um a aproveitar a fama.
Ver originalResponder0
LightningLadyvip
· 11h atrás
De jeito nenhum acredito nisso.
Ver originalResponder0
BlockchainDecodervip
· 11h atrás
Do ponto de vista da teoria da arquitetura de IA, o ponto de ruptura do DeepSeek está na otimização do algoritmo de base, referindo-se aos dados dos artigos da conferência AAAI de 2023.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)