Já deves ter reparado que o ChatGPT é um chatbot muito básico que não pode conversar contigo a um nível pessoal ou atender às tuas necessidades específicas.

No entanto, imagina um chatbot do ChatGPT altamente inteligente que compreende todos os aspectos do teu negócio e que lida incansavelmente com as questões dos clientes 24 horas por dia, 7 dias por semana.

Isto é agora possível treinando um chatbot de IA com dados personalizados para criar um chatbot de IA personalizado para a tua empresa.

Com esta oportunidade emocionante, vamos explorar e partilhar as técnicas intrigantes, ferramentas e conselhos necessários para construir o teu próprio chatbot ChatGPT que pode potencialmente mudar a forma como comunicas com os visitantes do teu site.

O que é o ChatGPT?

ChatGPT é um chatbot de IA desenvolvido pela OpenAI. Cria respostas a partir da entrada do utilizador utilizando o processamento de linguagem natural e a aprendizagem automática. Os utilizadores podem conversar com o bot de IA para criar esboços, artigos, histórias e resumos com base nas suas conversas com o ChatGPT.

Este chatbot de IA tem uma grande vantagem - consegue recordar conversas anteriores, proporcionando uma interação tranquila da próxima vez. A sua utilização inicial baseia-se na tecnologia GPT-3.5, mas para aceder à GPT-4, é necessário um pacote Plus.

treina o chatgpt em dados personalizados

Características

O ChatGPT lembra-se de conversas anteriores e permite que os utilizadores façam perguntas de seguimento, proporcionando uma experiência de conversação de qualidade. Além disso, o ChatGPT foi treinado utilizando uma grande quantidade de dados da Internet.

Para além de gerar respostas a prompts, o ChatGPT também pode criar código de entrada e intermédio em qualquer linguagem de programação. Para isso, basta informar o ChatGPT da linguagem de programação que pretendes e descrever o código que necessitas. O ChatGPT analisará a tua entrada e gerará código na linguagem de programação especificada. Além disso, podes refinar ou encurtar o código gerado pelo ChatGPT para satisfazer as tuas necessidades específicas.

treina o chat gpt em dados personalizados

Outra caraterística do ChatGPT é que ele pode encontrar erros nos teus blocos de código e explicá-los a ti. Se houver um erro no teu código e não o conseguires encontrar, podes usar o ChatGPT! Agora vamos ver como podes treinar este chatbot inteligente com os teus próprios dados.

Como treinar o ChatGPT com os teus próprios dados?

Para atingir este objetivo, existem essencialmente dois métodos à tua disposição: um deles requer conhecimentos de programação, enquanto o outro pode ser completado sem qualquer experiência de codificação em apenas quatro minutos.

Se quiseres passar para a solução sem código, clica aqui.

Solução de código completo com o API

Antes de começarmos, devemos avisar que esta secção requer experiência de codificação e um conhecimento profundo do Pyhton. Se estás à procura de uma solução sem código, clica aqui. Antes de poderes treinar um chatbot ChatGPT AI personalizado, precisas de configurar um ambiente de software no teu computador. Aqui estão os passos para o fazeres.

Passo 1: Instalar o Python e atualizar

Antes de mais, transfere e instala o Python a partir do site oficial. Certifica-te de que assinalas a opção "Add Python.exe to PATH" durante a instalação. Em segundo lugar, actualiza o Pip, que é um gestor de pacotes que te permite instalar as bibliotecas Python.

Isto pode ser feito através do Terminal no Windows ou do Prompt de Comando no macOS. Por fim, instala as bibliotecas essenciais necessárias para treinar o teu chatbot, como a biblioteca OpenAI, GPT Index, PyPDF2 para analisar ficheiros PDF e PyCryptodome. Essas bibliotecas são cruciais para criar um Modelo de linguagem grande (LLM) que pode se conectar à sua base de conhecimento e treinar seu chatbot de IA personalizado.

Passo 2: Instala um editor de código (como o VS Code)

Em primeiro lugar, transfere um editor de código, como o Notepad++ para Windows ou o Sublime Text para macOS e Linux, se tiveres experiência com IDEs mais potentes, como o VS Code.

Passo 3: Gera a tua chave API e a tua chave secreta

Em seguida, precisarás de uma chave API da OpenAI para treinar e criar um chatbot que utilize uma base de conhecimentos personalizada. Para obter esta chave, cria uma conta no OpenAI ou inicia sessão na tua conta existente, depois selecciona "Ver chaves API " no teu perfil e clica em "Criar nova chave secreta" para gerar uma chave API única. É importante guardar esta chave num ficheiro de texto simples e mantê-la privada, uma vez que só está acessível à tua conta. Além disso, podes criar até cinco chaves API , se necessário.

como treinar o chatgpt com os teus próprios dados

Depois de configurares o teu ambiente de software e de obteres uma chave OpenAI API , está na altura de treinares o teu próprio chatbot de IA utilizando os teus dados.

Passo 4: Selecionar o teu modelo e criar a tua base de conhecimentos

Podes optar por utilizar o modelo "gpt-3.5" ou "gpt-4". Para começar, cria uma pasta com o nome "docs" e adiciona os teus documentos de formação, que podem ter a forma de ficheiros de texto, PDF, CSV ou SQL.

como treinar o chatgpt em dados personalizados

Passo 5: Cria o guião

Em seguida, abre o teu editor de código e guarda o seguinte código como "app.py" na mesma pasta que a pasta "docs". Certifica-te de que substituis o texto "Your API Key" no código pela chave API que obtiveste da OpenAI e guarda as alterações.


from gpt_index import SimpleDirectoryReader, GPTListIndex, GPTSimpleVectorIndex, LLMPredictor, PromptHelper
from langchain import OpenAI
importa gradio as gr
importa sys
importa os

os.environ["OPENAI_API_KEY"] = ''

def construct_index(directory_path):
    max_input_size = 4096
    num_outputs = 512
    max_chunk_overlap = 20
    limite_de_tamanho_do_chunk = 600

    prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)

    llm_predictor = LLMPredictor(llm=OpenAI(temperature=0.7, model_name="text-davinci-003", max_tokens=num_outputs))

    documentos = SimpleDirectoryReader(directory_path).load_data()

    índice = GPTSimpleVectorIndex(documents, llm_predictor=llm_predictor, prompt_helper=prompt_helper)

    index.save_to_disk('index.json')

    devolve o índice

def chatbot(texto_de_entrada):
    index = GPTSimpleVectorIndex.load_from_disk('index.json')
    response = index.query(input_text, response_mode="compact")
    retorna response.response

iface = gr.Interface(fn=chatbot,
                     inputs=gr.inputs.Textbox(lines=7, label="Introduz o teu texto"),
                     outputs="texto",
                     title="O meu chatbot de IA")

indexa = construct_index("docs")
iface.launch(share=True)

Depois de executares o código no Terminal para processar os teus documentos e criar um ficheiro JSON, será gerado um URL local. Basta copy e colar este URL no teu browser para acederes ao teu chatbot ChatGPT AI personalizado.

Agora, podes fazer perguntas ao teu chatbot e receber respostas com base nos dados que forneceste.

Solução sem código com TextCortex - Bases de Dados de Conhecimento

É simples treinar a tua inteligência artificial (IA) utilizando os teus próprios dados com TextCortex. Além disso, podes personalizá-la ainda mais com personas personalizadas, adicionando entradas personalizadas, como a voz e o estilo. As personas personalizadas ajudam a criar gémeos virtuais ou representantes da marca adaptados à tua imaginação.

Se fores um aprendiz visual, vê este pequeno vídeo sobre como podes criar a tua base de conhecimentos e treinar o Zeno com os teus próprios dados.

E antes de começarmos a mostrar como podes conseguir isso em passos muito simples, vê-o em ação para perceberes o valor que pode dar às tuas necessidades.

Como treinar a IA em dados personalizados? - Guia rápido passo a passo

1. Navega até à secção Personalizações. A partir daí, clica no separador "Bases de conhecimentos" e clica no botão "Criar a tua base de conhecimentos".

Tem também em atenção que, se tiveres ficheiros carregados que ainda não tenhas adicionado a qualquer base de conhecimentos, encontrá-los-ás no separador "Histórico de carregamentos".

treina o chatgpt nos teus dados

3. Dá um nome fixe à tua base de conhecimentos e define as definições de acesso, se quiseres. Podes mantê-la privada ou partilhá-la com a tua equipa.

treina o chat gpt com os teus próprios dados

4. Depois de criares a tua base de conhecimentos, verás uma vista semelhante a uma unidade onde podes carregar conectores (documentos, URLs personalizados, etc.)

treina o chat gpt em dados personalizados

5. Podes optar por carregar documentos ou adicionar URLs personalizados à tua base de conhecimentos. Atualmente, suportamos os formatos de ficheiro PDF, CSV, PPTX e DOCX. Tem em atenção que todos os ficheiros são processados por TextCortex sem recurso a terceiros.

Consulta o nosso artigo "Como tratamos os dados em TextCortex " para obteres mais informações.

Dica profissional: Também podes inserir vários ficheiros para permitir o carregamento em massa.

treina o chatgpt em pdf

6. Quando os teus ficheiros tiverem sido carregados, vai ao ZenoChat e localiza o botão "Enable Search" (Ativar pesquisa ). Ao ativar esta opção, poderás selecionar entre várias bases de conhecimento como informação de base para as respostas da IA.

Já está! Agora estás pronto para aproveitar todo o poder da nossa nova funcionalidade Bases de Conhecimento. Vai em frente e cria várias bases de conhecimentos para uma variedade de fins.

Aqui está um pequeno exemplo do que podes fazer com ele! ⬇️

Conselhos profissionais

Certifica-te de que és muito específico quando fazes perguntas à tua IA. Lembra-te, a tua IA é tão capaz como a tua orientação; quanto mais específicas forem as instruções que deres, melhores resultados obterás em troca.