Ir para o conteúdo

DeepSeek

Origem: Wikipédia, a enciclopédia livre.
Hangzhou DeepSeek Artificial Intelligence Co., Ltd.
杭州深度求索人工智能基础技术研究有限公司
Image
TipoPrivada
Fundaçãomaio de 2023; há 3 anos
SedeHangzhou, China
Fundador(a)Liang Wenfeng
EmpregadosMenos de 200
Área de influênciaTecnologia de informação
Inteligência artificial
Websitedeepseek.com

Hangzhou DeepSeek Artificial Intelligence Co., Ltd.[1], comumente chamada de DeepSeek, (chinês:深度求索; pinyin: Shēndù Qiúsuǒ) é uma empresa chinesa de inteligência artificial especializada no desenvolvimento de modelos de linguagem de grande porte (LLMs) de código aberto. Sediada em Hangzhou, a companhia é propriedade e recebe financiamento do fundo de hedge chinês High-Flyer, cujo cofundador, Liang Wenfeng, fundou a empresa em 2023 e atualmente ocupa o cargo de CEO.[2]

O modelo DeepSeek-R1 apresentou desempenho superior em testes com modelos otimizados para processamento de imagens e análise de dados complexos, quando comparado a outros modelos de linguagem de grande porte contemporâneos, como o GPT-4 da OpenAI.[3][4] Ele foi treinado a um custo significativamente mais baixo, US$ 6 milhões, em comparação com US$ 100 milhões para o GPT-4 da OpenAI em 2023, e requer apenas um décimo da potência computacional de um LLM equivalente. Os modelos de IA da DeepSeek foram desenvolvidos em meio a sanções dos Estados Unidos contra a Índia e a China relacionadas aos chips da Nvidia, que visavam restringir a capacidade desses dois países de desenvolver sistemas avançados de IA.[5][6][7]

A DeepSeek disponibiliza seus algoritmos de inteligência artificial generativa, modelos e detalhes de treinamento como código aberto, permitindo que seu código seja livremente acessado, utilizado, modificado e adaptado para a criação de novos projetos. A empresa recruta ativamente jovens pesquisadores de IA das principais universidades chinesas e também contrata profissionais de áreas fora da ciência da computação, com o objetivo de diversificar o conhecimento e as capacidades de seus modelos.[8][9] O DeepSeek atualmente está na versão "V-3.2".[10]

Histórico de lançamento

[editar | editar código]

Em 2 de novembro de 2023, a DeepSeek revelou seu primeiro modelo DeepSeek Coder, que era gratuito para uso comercial e totalmente de código aberto.[11]

Em 29 de novembro de 2023, a DeepSeek lançou o DeepSeek LLM (modelo de linguagem grande), que foi dimensionado para até 67 bilhões de parâmetros. Ele foi desenvolvido para competir com outros LLMs disponíveis na época, com um desempenho próximo ao do GPT-4. No entanto, enfrentou desafios em termos de eficiência computacional e escalabilidade.[11] Uma versão de chat do modelo chamada DeepSeek Chat também foi lançada.[12]

Em maio de 2024, o DeepSeek-V2 foi lançado. O Financial Times informou que era mais barato que seus pares, com um preço de 2 RMB para cada milhão de tokens produzidos. A tabela de classificação do Tiger Lab da Universidade de Waterloo classificou o DeepSeek-V2 em sétimo lugar em sua classificação LLM. DeepSeek-V2 introduziu MLA, um mecanismo de atenção que otimiza o cache KV durante inferência, drasticamente reduzindo o tamanho e mantendo ou melhorando performance em relação a outro métodos. [13]

Em novembro de 2024, foi lançado o DeepSeek R1-Lite-Preview, projetado para se destacar em tarefas que exigem inferência lógica, raciocínio matemático e resolução de problemas em tempo real. A DeepSeek afirmou que superou o desempenho do OpenAI o1 em tarefas como o American Invitational Mathematics Examination (AIME) e o MATH.[14] No entanto, o The Wall Street Journal afirmou que, ao usar 15 problemas da edição de 2024 do AIME, o OpenAI o1 chegou às soluções mais rápido do que o DeepSeek R1-Lite-Preview.[15]

Em dezembro de 2024, o DeepSeek-V3 foi lançado. Veio com 671 bilhões de parâmetros e treinados em cerca de 55 dias a um custo de US$ 5,58milhões, usando significativamente menos recursos em comparação aos seus pares. Foi treinado em um conjunto de dados de 14,8 trilhões de tokens. Os testes de benchmark mostraram que ele superou o Llama 3.1 e o Qwen 2.5, ao mesmo tempo em que igualou o GPT-4o e o Claude 3.5 Sonnet.[16][17][18][19] A otimização do DeepSeek em recursos limitados destacou os potenciais limites das sanções dos EUA ao desenvolvimento da IA da China.[20][16] O custo total para treinar o modelo foi de US$ 5,58 milhões e levou cerca de dois meses para ser concluído.[16]

Em 10 de janeiro de 2025, a DeepSeek lançou seu primeiro aplicativo de chatbot, baseado no modelo DeepSeek-R1 para iOS e Android.[21] Seu lançamento acarretou em uma queda trilionária no mercado de ações,[22] em especial de empresas de tecnologia americanas e europeias, entre elas a Nvidia, que caiu em 600 bilhões de dólares em um único dia, a maior queda no mercado de ações na história.[23]

Em 24 de março de 2025, a DeepSeek lançou o modelo DeepSeek-V3-0324, um aprimoramento de seu modelo base anterior, melhorando o raciocínio e uso de ferramentas.[24]

Em 28 de maio de 2025, a DeepSeek lançou uma atualização para o modelo DeepSeek-R1, chamado DeepSeek-R1-0528. Esta atualização visava aprimorar as capacidades de raciocínio, programação e matemática e reduzindo halucinações.[25]

Em 21 de agosto de 2025, foi lançado o modelo DeepSeek-V3.1, um modelo híbrido com capacidade de respostas rápidas e com raciocínio. Foi desenvolvido para ter pensamento mais rápido e habilidade aprimorada de agente, melhorando o uso de ferramentas e execução de tarefas complexas.[26]

Em 22 de setembro de 2025, foi lançado uma atualização do modelo DeepSeek-V3.1, conhecido como DeepSeek-V3.1-Terminus. O lançamento deste modelo tinha como objetivo melhorar a consistência de linguagem e suas habilidades agênticas, entregando resultados mais estáveis e confiáveis comparado ao modelo anterior.[27]

Em 29 de setembro de 2025, a DeepSeek lançou o modelo DeepSeek-V3.2-Exp. Baseado no modelo DeepSeek-V3.1-Terminus. O modelo experimental introduziu a Atenção Esparsa DeepSeek (DSA), alcançando atenção esparsa com mínimo impacto na qualidade de resposta, com qualidade similar ao modelo anterior e maior eficiência, aumentando performance em contextos longos e reduzindo custo computacional, atingindo complexidade quase linear. Devido a sua performance, o preço por API foi reduzido pela metade.[28]

Em 1 de dezembro de 2025, foi lançado dois modelos: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale, sucessores do modelo experimental DeepSeek-V3.2-Exp. Foi introduzido o uso de ferramentas durante raciocínio e foram treinados usando um novo método de treinamento de agentes, usando mais de 1.800 ambientes e mais de 85.000 instruçoes complexas. V3.2-Speciale conseguiu medalha de ouro em olímpiadas como a IMO, CMO, ICPC World Finals e IOI 2025, requer maior uso de tokens para performance superior e não suporta o uso de ferramentas, foi deprecado em 15 de dezembro de 2025.[29]

A DeepSeek declarou que prioriza a pesquisa em inteligência artificial e que não tinha, ao menos inicialmente, planos imediatos de comercialização em larga escala. Segundo análises publicadas em 2024 e 2025, essa estratégia diferenciou a empresa de concorrentes voltados mais diretamente à monetização de modelos e aplicativos, além de contribuir para que a companhia operasse com maior foco em desenvolvimento técnico e científico.[30][31]

Controvérsias

[editar | editar código]

Algumas fontes observaram que a versão oficial da API do R1 usa mecanismos de censura para tópicos considerados politicamente sensíveis para o governo da China. Por exemplo, o modelo se recusa a responder perguntas sobre os protestos e massacres da Praça da Paz Celestial de 1989, perseguição de uigures, comparações entre Xi Jinping e o Ursinho Pooh ou direitos humanos na China.[32][33][34] A IA pode inicialmente gerar uma resposta, mas depois a exclui logo depois e a substitui por uma mensagem como: "Desculpe, isso está além do meu escopo atual. Vamos falar sobre outra coisa."[33]

Os mecanismos de censura e restrições integrados só podem ser removidos até certo ponto na versão de código aberto do modelo R1. Se os "valores socialistas essenciais" definidos pelas autoridades reguladoras da Internet chinesas forem tocados ou o status político de Taiwan for levantado, as discussões serão encerradas.[35]

Quando testado pela NBC News, o R1 do DeepSeek descreveu Taiwan como "uma parte inalienável do território da China" e declarou: "Nós nos opomos firmemente a qualquer forma de atividade separatista de 'independência de Taiwan' e estamos comprometidos em alcançar a reunificação completa da pátria por meios pacíficos."[36] Em janeiro de 2025, pesquisadores ocidentais conseguiram enganar o DeepSeek para dar respostas precisas a alguns desses tópicos, solicitando em sua resposta a troca de certas letras por números de aparência semelhante.[34]

Ver também

[editar | editar código]

Referências

  1. «DeepSeek Terms of Use». deepseek.com. 20 de janeiro de 2025. Consultado em 10 de fevereiro de 2025
  2. «DeepSeek: chip mais barato, autocensura, 'ameaça' aos EUA... veja perguntas e respostas sobre a IA chinesa». G1. 29 de janeiro de 2025. Consultado em 1 de fevereiro de 2025
  3. Vincent, James (28 de janeiro de 2025). «The DeepSeek panic reveals an AI world ready to blow». The Guardian (em inglês). ISSN 0261-3077. Consultado em 1 de fevereiro de 2025
  4. «آموزش ثبت‌نام در دیپ‌سیک و دسترسی رایگان به مدل DeepSeek V3». شهر بورس
  5. «Após caso DeepSeek, EUA devem fiscalizar exportações da Nvidia com mais rigor». Valor Econômico. 30 de janeiro de 2025. Consultado em 1 de fevereiro de 2025
  6. Mallick, Subhrojit; Lohchab, Himanshi (16 de janeiro de 2025). «Biden admin's cap on GPU exports may hit India's AI ambitions». The Economic Times. ISSN 0013-0389. Consultado em 1 de fevereiro de 2025
  7. «Nvidia investigation signals widening of US and China chip war | Computer Weekly». ComputerWeekly.com (em inglês). Consultado em 1 de fevereiro de 2025
  8. Metz, Cade (27 de janeiro de 2025). «What to Know About DeepSeek and How It Is Upending A.I.». The New York Times (em inglês). ISSN 0362-4331. Consultado em 1 de fevereiro de 2025
  9. Metz, Cade; Tobin, Meaghan (23 de janeiro de 2025). «How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants». The New York Times (em inglês). ISSN 0362-4331. Consultado em 1 de fevereiro de 2025
  10. «DeepSeek | 深度求索». www.deepseek.com (em chinês). Consultado em 1 de fevereiro de 2026
  11. 1 2 Se, Ksenia (28 de agosto de 2024). «Inside DeepSeek Models». Turing Post (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 18 de setembro de 2024
  12. Sharma, Shubham (1 de dezembro de 2023). «Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model». VentureBeat (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 23 de dezembro de 2024
  13. McMorrow, Ryan; Olcott, Eleanor (9 de junho de 2024). «The Chinese quant fund-turned-AI pioneer». Financial Times. Consultado em 28 de dezembro de 2024. Arquivado do original em 17 de julho de 2024
  14. Franzen, Carl (20 de novembro de 2024). «DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance». VentureBeat (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 22 de novembro de 2024
  15. Huang, Raffaele (24 de dezembro de 2024). «Don't Look Now, but China's AI Is Catching Up Fast». The Wall Street Journal (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 27 de dezembro de 2024
  16. 1 2 3 Jiang, Ben; Perezi, Bien (1 de janeiro de 2025). «Meet DeepSeek: the Chinese start-up that is changing how AI models are trained». South China Morning Post (em inglês)
  17. Jiang, Ben (27 de dezembro de 2024). «Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products». South China Morning Post (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 27 de dezembro de 2024
  18. Sharma, Shubham (26 de dezembro de 2024). «DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch». VentureBeat (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 27 de dezembro de 2024
  19. Wiggers, Kyle (26 de dezembro de 2024). «DeepSeek's new AI model appears to be one of the best 'open' challengers yet». TechCrunch
  20. Shilov, Anton (27 de dezembro de 2024). «Chinese AI company's AI model breakthrough highlights limits of US sanctions». Tom's Hardware (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 28 de dezembro de 2024
  21. «Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce». GitHub (em inglês). Consultado em 28 de janeiro de 2025
  22. «Empresas de tecnologia perdem US$ 1 trilhão em valor de mercado com 'ameaça' de IA chinesa». G1. 27 de janeiro de 2025. Consultado em 28 de janeiro de 2025
  23. Saul, Derek. «Biggest Market Loss In History: Nvidia Stock Sheds Nearly $600 Billion As DeepSeek Shakes AI Darling». Forbes (em inglês). Consultado em 28 de janeiro de 2025
  24. «DeepSeek-V3-0324 Release | DeepSeek API Docs». api-docs.deepseek.com (em inglês). Consultado em 12 de fevereiro de 2026
  25. «DeepSeek-R1-0528 Release | DeepSeek API Docs». api-docs.deepseek.com (em inglês). Consultado em 12 de fevereiro de 2026
  26. «DeepSeek-V3.1 Release | DeepSeek API Docs». api-docs.deepseek.com (em inglês). Consultado em 12 de fevereiro de 2026
  27. «DeepSeek-V3.1-Terminus | DeepSeek API Docs». api-docs.deepseek.com (em inglês). Consultado em 12 de fevereiro de 2026
  28. «Introducing DeepSeek-V3.2-Exp | DeepSeek API Docs». api-docs.deepseek.com (em inglês). Consultado em 12 de fevereiro de 2026
  29. «DeepSeek-V3.2 Release | DeepSeek API Docs». api-docs.deepseek.com (em inglês). Consultado em 12 de fevereiro de 2026
  30. «The Chinese quant fund-turned-AI pioneer». Financial Times. 9 de junho de 2024. Consultado em 19 de março de 2026
  31. «DeepSeek to focus on research over revenue in contrast to Silicon Valley, FT reports». Reuters. 14 de março de 2025. Consultado em 19 de março de 2026
  32. Field, Matthew; Titcomb, James (27 de janeiro de 2025). «Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech». The Daily Telegraph (em inglês). ISSN 0307-1235. Consultado em 27 de janeiro de 2025
  33. 1 2 Steinschaden, Jakob (27 de janeiro de 2025). «DeepSeek: This is what live censorship looks like in the Chinese AI chatbot». Trending Topics (em inglês). Consultado em 27 de janeiro de 2025
  34. 1 2 Lu, Donna (28 de janeiro de 2025). «We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan». The Guardian (em inglês). ISSN 0261-3077. Consultado em 30 de janeiro de 2025
  35. «The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos». The Guardian (em inglês). 26 de janeiro de 2025. ISSN 0261-3077. Consultado em 27 de janeiro de 2025
  36. Yang, Angela; Cui, Jasmine (27 de janeiro de 2025). «Chinese AI DeepSeek jolts Silicon Valley, giving the AI race its 'Sputnik moment'». NBC News (em inglês). Consultado em 27 de janeiro de 2025

Ligações externas

[editar | editar código]
Image
O Commons possui uma categoria com imagens e outros ficheiros sobre DeepSeek