Se estiveres à procura de um LLM que ofereça um desempenho semelhante ao modelo de linguagem grande OpenAI-o1, mas que seja muito mais barato, não procures mais do que o DeepSeek R1. O DeepSeek R1 é um LLM totalmente de código aberto licenciado pelo MIT (Massachusetts Institute of Technology). O modelo DeepSeek R1 vem em duas versões diferentes, 70b e 32b. Se estiveres à procura de uma alternativa LLM de alto desempenho ao modelo OpenAI-o1, recomendamos que coloques o modelo DeepSeek R1 no teu radar.
Neste artigo, vamos examinar o modelo DeepSeek R1 e explorar as suas caraterísticas.
Estás pronto?
Vamos mergulhar!
TL; DR
- O DeepSeek-R1 é um modelo de linguagem de grande dimensão desenvolvido e publicado pela startup chinesa DeepSeek que tem um desempenho quase igual ao do modelo OpenAO-o1.
- Podes aceder ao modelo DeepSeek R1 através do site oficial do DeepSeek ou do GitHub.
- O modelo DeepSeek R1 tem uma política de preços muito mais baixa do que o seu concorrente, o modelo OpenAI-o1.
- O modelo DeepSeek R1 tem pontuações próximas às do modelo OpenAI-o1 na maioria dos benchmarks em termos de linguagem natural, matemática, raciocínio e desempenho de codificação, e supera-o em alguns.
- Se precisar de um assistente de IA que possa integrar vários LLMs, como o OpenAI-o1, o DeepSeek R1 e o Claude 3.5 Sonnet, na sua organização e aumentar a sua eficiência geral, o TextCortex é o caminho a seguir.
O que é o DeepSeek R1?
O modelo DeepSeek R1 é um modelo de linguagem grande desenvolvido para executar tarefas complexas de raciocínio, resolução de problemas matemáticos e programação. O modelo DeepSeek R1 gera saída usando seus parâmetros construídos com a abordagem Mixture of Experts (MoE) com eficiência máxima. O modelo DeepSeek R1 vem em duas versões diferentes, 70b e 32b, dependendo das áreas de uso e das necessidades.

Como aceder ao DeepSeek R1?
Se quiseres aceder ao modelo DeepSeek R1 como um chatbot de IA, basta ires ao site oficial do DeepSeek e clicar no botão "Start Now". Serás então direcionado para uma interface web de chatbot de IA onde poderás aceder ao modelo DeepSeek R1 com acesso limitado.

Se quiseres utilizar o modelo DeepSeek R1 como uma API, podes instalá-lo através do site oficial do DeepSeek ou instalá-lo através do GitHub.
Usando o DeepSeek R1 via TextCortex
O método inovador e alternativo para aceder ao modelo DeepSeek R1 é experimentá-lo através do TextCortex. TextCortex tem uma biblioteca de vários LLMs, incluindo OpenAI-o1, GPT-4o e Claude 3.5 Sonnet, para fornecer o melhor serviço e soluções orientadas para tarefas aos seus utilizadores. Um dos mais recentes membros desta biblioteca é o modelo DeepSeek R1. Se estiveres à procura de um método para integrar o modelo DeepSeek R1 diretamente no teu fluxo de trabalho, TextCortex é a tua salvação. Para usar o modelo DeepSeek R1 via TextCortex, tudo o que precisas fazer é selecionar o modelo DeepSeek R1 nas configurações de chat do ZenoChat.
Preços do DeepSeek R1
Podes utilizar o modelo DeepSeek R1 como um chatbot de IA gratuitamente através do seu site oficial. Se utilizares o modelo DeepSeek R1 como API, ser-te-á cobrado o seguinte.
- Preço de acerto da cache de entrada: $0.14 / 1M Tokens
- Input Cache Miss Preço: $0.55 / 1M Tokens
- Preço de saída: $2.19 / 1M Tokens

Caraterísticas do DeepSeek R1
Embora o modelo DeepSeek R1 tenha um preço mais baixo do que LLMs avançados como o OpenAI-o1, não fica atrás deles em termos de desempenho. O modelo DeepSeek R1 pode lidar facilmente com tarefas avançadas de raciocínio e codificação, tanto com sua arquitetura quanto com seu desempenho em benchmarks. Vamos dar uma olhada mais de perto nos recursos do DeepSeek R1.
Arquitetura do DeepSeek R1
A arquitetura do modelo DeepSeek R1 foi desenvolvida para equilibrar desempenho e eficiência. Aqui estão as especificações do modelo:
- Parâmetros totais: 671 mil milhões
- Parâmetros activos por Token: 37 mil milhões
- Dados de treino: 14,8 triliões de fichas
- Janela de contexto: 128K Tokens
O modelo DeepSeek R1 usa a abordagem Mixture of Experts (MoE), Multi-head Latent Attention (MLA) e Multi-Token Prediction (MTP) durante o treinamento e a geração de saída. Essa abordagem garante que o modelo forneça o melhor resultado com erro e custo mínimos.
Desempenho do DeepSeek R1
Apesar da sua política de preços baixos, o modelo DeepSeek R1 é um LLM com um desempenho que compete com o modelo OpenAI-o1. No que diz respeito às capacidades de linguagem natural do DeepSeek R1, este conseguiu atingir uma pontuação de 90,8 no benchmark MMLU (Measuring Massive Multitask Language Understanding). De acordo com o mesmo benchmark, o modelo OpenAI-o1 tem uma pontuação de 91,8, e o modelo OpenAI-o1 mini tem uma pontuação de 88,5.

Quando se trata do desempenho de raciocínio e codificação do DeepSeek R1, ele tem uma pontuação de 96,3 no benchmark Codeforce, 71,5 no benchmark GPQA-diamond e 97,3 no benchmark MATH-500. O modelo DeepSeek R1, que se aproxima muito do modelo OpenAI-o1 com seu desempenho nos benchmarks Codeforce e GPQA-diamond, conseguiu superar o modelo OpenAI-o1 no benchmark MATH-500.
DeepSeek R1 Raciocínio e codificação
Embora o modelo DeepSeek R1 seja bem-sucedido em lidar com tarefas de processamento de linguagem natural, as tarefas em que ele se destaca são raciocínio e codificação. O modelo DeepSeek R1 oferece aos seus utilizadores uma elevada eficiência na resolução de problemas matemáticos complexos.

O modelo DeepSeek R1 pode ser considerado uma opção econômica, mas de alto desempenho para tarefas de codificação com seu desempenho em benchmarks de codificação. Tem pontuações quase iguais às do modelo OpenAI-o1 em benchmarks de codificação. Além disso, o modelo demonstra a capacidade de dividir os problemas em etapas menores usando o raciocínio de cadeia de pensamento.
TextCortex
Se estás à procura de um assistente de IA de empresa com LLMs avançados, como o OpenAI-o1, o Claude 3.5 Sonnet e o DeepSeek R1, então TextCortex foi concebido para ti.

TextCortex oferece funcionalidades como vários LLMs, vários geradores de imagens, pesquisa na Web, bases de dados de conhecimento, RAG potente e assistência à escrita para automatizar fluxos de trabalho complexos e aumentar os jogos de gestão do conhecimento para os seus utilizadores. Com o TextCortex, podes poupar tempo automatizando as tuas tarefas profissionais e pessoais.
TextCortex não só ajuda as organizações a aliviar a sua carga de trabalho profissional, como também te ajuda a aumentar o desempenho individual dos teus funcionários. Utilizando o ZenoChat, um assistente de IA conversacional desenvolvido pela TextCortex, podes fornecer a todos os teus funcionários um acesso rápido aos dados da tua base de conhecimentos e fornecer-lhes um assistente de IA multifuncional. Vê os resultados de um dos nossos estudos de caso:
- TextCortex foi implementado para Kemény Boehme Consultants como solução para enfrentar estes desafios e, atualmente, os funcionários relatam um aumento da eficiência e da produtividade(poupando, em média, 3 dias de trabalho por mês por funcionário).
- A AICX, um parceiro do ecossistema de TextCortex, foi parte integrante da integração e ajudou a atingir uma taxa de ativação da equipa de 70% nas primeiras semanas.
- A confiança dos funcionários na utilização e no trabalho com a IA aumentou 60%.
- A implementação resulta num retorno do investimento (ROI) de 28 vezes.
Perguntas frequentes
O DeepSeek-R1 é gratuito?
Embora o modelo DeepSeek R1 seja gratuito para ser usado como um chatbot de IA, se quiseres usá-lo como uma API, terás de pagar $0,14 por milhão de tokens para acessos à cache de entrada, $0,55 por milhão de tokens para falhas na cache de entrada e $2,19 por milhão de tokens de saída.
O que é o DeepSeek-R1?
O modelo DeepSeek-R1 é um modelo de linguagem grande que oferece alto desempenho de codificação, raciocínio, matemática e linguagem natural que podes usar como uma alternativa económica ao modelo OpenAI-o1. Podes usar o modelo DeepSeek-R1 como um chatbot de IA e concluir as tuas tarefas num formato de conversação com ele, ou podes integrá-lo nas tuas aplicações como uma API. Por exemplo, podes criar um agente de IA com DeepSeek-R1 integrando a API DeepSeek-R1 em construtores de agentes de IA, como o AutoGen.
O DeepSeek-R1 é chinês?
O DeepSeek é um LLM licenciado pelo MIT desenvolvido por uma startup chinesa que oferece um desempenho que rivaliza com o modelo R1 e o modelo OpenAI-o1. O modelo DeepSeek-R1 oferece um desempenho quase igual ao do modelo OpenAI-o1 a um preço muito mais baixo.
%20(1).png)