Du kanske redan har märkt att ChatGPT är en mycket grundläggande chatbot som inte kan konversera med dig på en personlig nivå eller tillgodose dina specifika behov.

Men tänk dig en mycket intelligent ChatGPT-chattbot som förstår alla aspekter av ditt företag och outtröttligt hanterar kundförfrågningar 24/7.

Detta är nu möjligt genom att träna en AI-chattbot på personliga data för att skapa en anpassad AI-chattbot för ditt företag.

Med denna spännande möjlighet kommer vi att utforska och dela de spännande tekniker, verktyg och råd som behövs för att bygga din egen ChatGPT-chattbot som potentiellt kan förändra hur du kommunicerar med dina webbplatsbesökare.

Vad är ChatGPT?

ChatGPT är en AI-chattbot som utvecklats av OpenAI. Den skapar svar från användarens input genom att använda naturlig språkbehandling och maskininlärning. Användare kan chatta med AI-boten för att skapa dispositioner, artiklar, berättelser och sammanfattningar baserade på deras konversationer med ChatGPT.

Denna AI-chattbot har en stor fördel - den kan minnas tidigare konversationer, vilket ger ett smidigt engagemang nästa gång. Dess ursprungliga användning är baserad på GPT-3.5-teknik, men för att utnyttja GPT-4 behöver man ett Plus-paket.

träna chatgpt på anpassade data

Funktioner

ChatGPT kommer ihåg tidigare chattar och låter användarna ställa uppföljningsfrågor, vilket ger en högkvalitativ samtalsupplevelse. ChatGPT tränades dessutom med hjälp av en stor mängd internetdata.

Förutom att generera svar på uppmaningar kan ChatGPT också skapa ingångs- och mellanliggande kod i alla programmeringsspråk. För att åstadkomma detta behöver du bara informera ChatGPT om vilket programmeringsspråk du behöver och beskriva den kod du behöver. ChatGPT kommer att analysera din inmatning och generera kod på det angivna programmeringsspråket. Dessutom kan du förfina eller förkorta den kod som ChatGPT genererar för att uppfylla dina specifika behov.

train chat gpt på anpassade data

En annan egenskap hos ChatGPT är att den kan hitta fel i dina kodblock och förklara dem för dig. Om det finns ett fel i din kod och du inte kan hitta det, kan du använda ChatGPT! Låt oss nu gå vidare till hur du kan träna denna smarta chatbot på dina egna data.

Hur tränar man ChatGPT på egna data?

För att uppnå detta mål finns det i huvudsak två metoder tillgängliga: en av dem kräver expertis inom programmering, medan den andra kan slutföras utan någon kodningserfarenhet på bara fyra minuter.

Om du vill hoppa till lösningen utan kod, klicka här.

Fullständig kodlösning med API

Innan vi börjar bör vi varna för att detta avsnitt kräver kodningserfarenhet och omfattande förståelse av Pyhton. Om du letar efter en lösning utan kod, klicka här . Innan du kan träna en anpassad ChatGPT AI-chattbot måste du ställa in en programvarumiljö på din dator. Här är stegen för att göra det.

Steg 1: Installera Python och uppgradera

Först och främst, ladda ner och installera Python från den officiella webbplats. Se till att markera alternativet "Add Python.exe to PATH" under installationen. För det andra, uppgradera Pip, som är en pakethanterare som låter dig installera Python-bibliotek.

Detta kan göras via Terminalen på Windows eller Kommandotolken på macOS. Slutligen ska du installera de viktiga bibliotek som behövs för att träna din chatbot, t.ex. OpenAI-biblioteket, GPT Index, PyPDF2 för parsning av PDF-filer och PyCryptodome. Dessa bibliotek är avgörande för att skapa en Large Language Model (LLM) som kan ansluta till din kunskapsbas och träna din anpassade AI-chattbot.

Steg 2: Installera en kodredigerare (t.ex. VS Code)

Ladda först ned en kodredigerare som Notepad++ för Windows eller Sublime Text för macOS och Linux om du har erfarenhet av mer kraftfulla IDE:er som t.ex. VS Kod.

Steg 3: Generera din API nyckel och hemliga nyckel

Därefter behöver du en API -nyckel från OpenAI för att träna och skapa en chatbot som använder en anpassad kunskapsbas. För att få tag denna nyckel, skapa ett konto på OpenAI eller logga in på ditt befintliga konto, välj sedan "Visa API nycklar" från din profil och klicka på "Skapa ny hemlig nyckel" för att generera en unik API nyckel. Det är viktigt att du sparar nyckeln i en vanlig textfil och håller den privat eftersom den bara är tillgänglig för ditt konto. Du kan dessutom skapa upp till fem API -nycklar om det behövs.

hur du tränar chatgpt på dina egna data

När du har konfigurerat din programvarumiljö och fått en OpenAI API -nyckel är det dags att träna din egen AI-chattbot med hjälp av dina data.

Steg 4: Välj din modell och skapa din kunskapsbas

Du kan välja att använda antingen "gpt-3.5"-modellen eller "gpt-4". Börja med att skapa en mapp med namnet "docs" och lägg till dina utbildningsdokument, som kan vara i form av text-, PDF-, CSV- eller SQL-filer, i den.

hur man tränar chatgpt på anpassade data

Steg 5: Skapa skriptet

Öppna sedan din kodredigerare och spara följande kod som "app.py" i samma mapp som mappen "docs". Se till att ersätta texten "Your API Key" i koden med den API -nyckel som du fick från OpenAI och spara ändringarna.


från gpt_index importera SimpleDirectoryReader, GPTListIndex, GPTSimpleVectorIndex, LLMPredictor, PromptHelper
från langchain importera OpenAI
importera gradio som gr
Importera sys
importera os

os.environ["OPENAI_API_KEY"] = ''

def construct_index(katalog_väg):
    max_input_size = 4096
    antal_utgångar = 512
    max_chunk_överlappning = 20
    chunk_size_limit = 600

    prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)

    llm_predictor = LLMPredictor(llm=OpenAI(temperature=0.7, model_name="text-davinci-003", max_tokens=num_outputs))

    documents = SimpleDirectoryReader(directory_path).load_data()

    index = GPTSimpleVectorIndex(documents, llm_predictor=llm_predictor, prompt_helper=prompt_helper)

    index.save_to_disk('index.json')

    returnera index

def chatbot(input_text):
    index = GPTSimpleVectorIndex.load_from_disk('index.json')
    svar = index.query(input_text, response_mode="compact")
    returnera svar.svar

iface = gr.Interface(fn=chatbot,
                     inputs=gr.inputs.Textbox(lines=7, label="Ange din text"),
                     outputs="text",
                     title="Min AI-chattbot")

index = construct_index("docs")
iface.launch(dela=True)

När du har kört koden i Terminal för att bearbeta dina dokument och skapa en JSON-fil kommer en lokal URL att genereras. Du behöver bara copy och klistra in denna URL i din webbläsare för att komma åt din skräddarsydda ChatGPT AI-chattbot.

Nu kan du ställa frågor till din chatbot och få svar baserat på de uppgifter du har lämnat.

Lösning utan kod med TextCortex - Kunskapsbaserna

Det är enkelt att träna din artificiella intelligens (AI) med hjälp av dina egna data med TextCortex. Dessutom kan du anpassa den ytterligare med anpassade personas genom att lägga till personlig input, t.ex. röst och stil. Med anpassade personas kan du skapa virtuella tvillingar eller varumärkesrepresentanter som är skräddarsydda efter din fantasi.

Om du är en visuell inlärare kan du titta på den här korta videon om hur du kan skapa din kunskapsbas och träna Zeno på dina egna data.

Och innan vi börjar förklara hur du kan uppnå detta med mycket enkla steg bör du se det i praktiken för att förstå hur mycket värde det kan ge för dina behov.

Hur tränar man AI på anpassade data? - Snabbguide steg för steg

1. Navigera till avsnittet Anpassningar. Klicka sedan på fliken "Kunskapsbaser" och tryck på knappen "Skapa din kunskapsbas".

Tänk också på att om du har några uppladdade filer som du inte har lagt till i någon kunskapsbas ännu, hittar du dem på fliken "Uppladdningshistorik".

träna chatgpt på dina data

3. Ge din kunskapsdatabas ett coolt namn och ställ in åtkomstinställningar om du vill. Du kan hålla den privat eller dela den med hela teamet.

träna chat gpt på dina egna data

4. När du har skapat din kunskapsbas ser du en körliknande vy där du kan ladda upp anslutningar (dokument, anpassade webbadresser etc.)

train chat gpt på anpassade data

5. Du kan välja att ladda upp dokument eller lägga till anpassade webbadresser till din kunskapsbas. Vi stöder för närvarande filformaten PDF, CSV, PPTX och DOCX. Tänk på att alla filer bearbetas av TextCortex utan användning av tredje part.

Se vår artikel "Hur vi hanterar data på TextCortex " för mer information.

Tips: Du kan också infoga flera filer för att möjliggöra massuppladdning.

tåg chatgpt på pdf

6. När dina filer har laddats upp, gå över till ZenoChat och leta reda på knappen "Aktivera sökning" . Genom att slå på den här knappen kan du välja mellan flera kunskapsbaser som basinformation för AI-svar.

Nu är det klart! Nu är du redo att utnyttja den fulla kraften i vår nya funktion Knowledge Bases. Gå vidare och skapa flera kunskapsbaser för en mängd olika ändamål.

Här är ett litet exempel på vad du kan göra med den! ⬇️

Proffsens råd

Se till att vara mycket specifik när du ställer frågor till din AI. Kom ihåg att din AI är lika kapabel som din vägledning; ju mer specifika instruktioner du ger, desto bättre resultat kommer du att få i gengäld.