Hur man avgör att texten är skriven av ett neuralt nätverk
Miscellanea / / August 21, 2023
Artificiell intelligens är en bra assistent inom många områden. Men du ska inte lita på honom villkorslöst.
Förbi data Bloomberg, cirka 30 % av specialisterna använder neurala nätverk för att generera text. I Ryssland, 67% av de tillfrågade vill ansöka i arbetet med artificiell intelligens för att arbeta mindre och inte förlora inkomst. Det är just sådan statistik som inte gläder alla kunder. Vissa litar inte på neurala nätverk, så de föredrar att texter inte skrivs av robotar, utan av människor.
Vi förstår varför kunderna är försiktiga med teknik och vilka sätt att exponera neurotexter som finns idag.
Varför texter från neurala nätverk bör behandlas med försiktighet
Här är de främsta anledningarna till varför kunder är försiktiga med sådana artiklar.
Risk för upphovsrättsintrång
Idag finns det inget officiellt ställningstagande i frågan om vem tillhöra upphovsrätt för texter skapade med hjälp av AI. Enligt lagen är en författare en person som skapar ett verk genom skapande eller intellektuellt arbete. Men i fallet med
neuralt nätverk människor ger bara instruktioner, men skriver inte själva.Eftersom nu lagen inte erkänner neurotexter som föremål för upphovsrätt, bestäms reglerna för användning av innehåll som genereras av teknik i användaravtalet för det neurala nätverket.
Och om Open AI sänder rättigheter till texten även i gratisversionen, sedan Gerwin gränser dess användning för politiska, diskriminerande syften eller i ogynnsam reklam. Och i midjourney använda innehållet för kommersiella ändamål Burk endast om produkten genereras till en betald kurs.
Risk för att få icke-unik eller felaktig information
Det neurala nätverket tar emot en förfrågan, skickar den genom algoritmer, analyserar tillgänglig information om ämnet och ger ett svar. Utan att förneka att samma begäran från en annan användare kan producera en liknande eller liknande text.
Och här kommer en ny fara. Forskare vid Cornell University kom fram till slutsats: om svaren från det neurala nätverket på samma fråga varierar mycket, kommer det med stor sannolikhet med fakta.
Risken att neurotexter sänker företagets resurs i sökresultat
I slutet av förra året, Googles kvalitetsspecialist Duy Nguyen deklareradeatt företaget har algoritmer på plats för att upptäcka och nedgradera innehåll som skapats artificiell intelligens. Därför fruktar många att sökmotorer kommer att leta efter sådant innehåll och pessimisera det. Det vill säga att sänka positionen i sökresultaten.
Prejudikat finns redan. Till exempel spenderade marknadsföraren Neil Patel experimenteragenom att skapa 50 testwebbplatser, som han delade in i två grupper. Experten fyllde webbplatserna i den första delen med artiklar skapade uteslutande av artificiell intelligens. Webbplatserna för den andra var värd för AI-artiklar modifierade av människor, såväl som material skrivet av copywriters utan användning av neurala nätverk.
Resultaten av experimentet visade att den första gruppens resurser förlorade flera positioner i sökresultaten. Och det ledde till minska trafik upp till 70 %.
Samtidigt tillade Google-representanter att de har en positiv inställning till utvecklingen av neurala nätverk och redan har skapat sina egna Chatbot Bard. Men för företaget är kvalitetstexter en prioritet. Systemet, som rangordnar resultaten, erbjuder först och främst användarna material som uppfyller standarder E‑E‑A‑T (erfarenhet, kompetens, trovärdighet, trovärdighet).
Texter som motsvarar dem inger förtroende och anses användbara eftersom de innehåller exempel, erfarenhet, en analytisk del och forskning. Och innehållet som neurala nätverk skapar, utan ytterligare djup förfining av en person, är ofta inte sådant.
Under tiden i statsduman föreslog införa märkning av material som skapats med hjälp av AI. Tills det händer, bestäm att texten genereras av ett neuralt nätverk, måste göra det själv. Eller med hjälp av specialtjänster.
Hur man självständigt avgör att texten skrevs av ett neuralt nätverk
MIREA Technological University höll nyligen experimentera, som deltog av 20 lärare och över 200 elever. Hälften av dem skrev vetenskapliga artiklar på egen hand. Och de andra 50% använde hjälp av neurala nätverk. Lärare, å andra sidan, var tvungna att beräkna sådana AI-material.
För att göra detta uppmärksammade lärare textens stilistiska och ortografiska drag. Till exempel för ett stort antal repetitiva ord och betydelser, faktiska och logiska misstag, brist på ursprungliga domar. På så sätt kunde lärare identifiera 96 % av arbetet som skrevs med hjälp av det neurala nätverket. 4 % av eleverna som inte exponerades erkände att de ägnat många timmar åt att redigera AI-text.
Det finns ingen universell instruktion som hjälper till att beräkna texten som genereras av det neurala nätverket. Experimentet visar dock att liknande mönster är inneboende i sådana material. Låt oss överväga dem mer i detalj.
Upprepningar av betydelser och ord
En av anledningarna till att en webbplats sänks i sökresultaten är omoptimering av sökord. Det neurala nätverket som svar på en förfrågan "svarar ofta i en cirkel". Ibland använder hon olika förekomster, men betydelsen upprepas ändå.
Så i skärmdumpen nedan fick artificiell intelligens i uppdrag att skriva ett säljinlägg om ett nytt, skonsamt sätt att färga hår. Och i en liten text upprepade det neurala nätverket samma teser upprepade gånger.
Nästan varje mening genererad text frasen "ett nytt sätt att färga" upprepas. Och det finns också en upprepad dubblering av betydelser om metodens säkerhet och ett individuellt tillvägagångssätt, vilket kommer att betona det unika hos varje klient.
Här är några citat från texten som illustrerar detta: "förvandla din bild och uttryck din individualitet", "ta hänsyn till din individualitet", "lämplig för dig", "skapa för dig". unik och snygg look", "gör din frisyr unik", "bevara hårets hälsa och glans", "säkert för ditt hår", "vård om ditt hår, bevara det hälsa".
Under tiden räckte det med att nämna en gång att ett nytt förfarande presenterades i salongen - sparsamt färgningsmetodsom kommer att hålla håret vid liv. Och förklara också hur metoden fungerar, vad är dess nyhet och varför den är säker. Och lägg till att färgpaletten är mångsidig, och mästarna som har utbildats kommer inte bara att utföra färgning med hög kvalitet, utan kommer också att hjälpa till med valet av färg.
Närvaron i texten av ett stort antal frimärken och klichéer, bristen på sensorisk erfarenhet
Färgningsexemplet visar också att ett neuralt nätverk inte kan imitera hur en person talar i verkligheten. Människor förseglar, använder slang och förkortningar, avsiktligt förvränga ord. En sådan presentation hjälper till att locka uppmärksamhet, framkalla känslor, förmedla författarens position, hans sensoriska upplevelse.
Forskning visa: det neurala nätverket delar inte känslor, accepterar inte någons position. Därför föredrar han neutralitet, klichéer och klichéer. I exemplet ovan är dessa "yrkeskunskaper", "material av hög kvalitet", "unik möjlighet".
Samtidigt genererar det neurala nätverket texter i olika stilar. Du kan till exempel ge henne i uppdrag att förbereda ett material på ämnet ”Vad påverkar kostnaden för olja». Men för att förtydliga att texten inte ska skrivas på ett torrt språk, utan med tillägg av metaforer och jämförelser. Resultatet är dock fortfarande konstlat. AI har trots allt inget mått, det "känner" inte texten som en person gör.
1 / 0
2 / 0
Ett av styckena kommer att hjälpa till att se att det erhållna resultatet inte kan jämföras med intonationen som är inneboende i en person: "Efterfrågan och utbud är som en dans av två älskare på oljemarknaden. Om efterfrågan på olja stiger som ett rasande hav, och om utbudet inte hänger med går priserna upp som champagne på en nyårsfest. Men om efterfrågan minskar och utbudet ökar, kan priserna sjunka som en ballong på ett barnkalas."
Texten verkar konstlad, och de flesta svängarna i den är malplacerade. Och även om inlägget verkligen visade sig vara "inte torrt", är det svårt att föreställa sig att en expert skulle ha skrivit på det här sättet. Dessutom är bokstavligen varje mening en metafor och jämförelse. Sådana tekniker bör dock vara exakta och snyggt inbäddade i texten. Annars kommer betydelsen att gå förlorad bakom ett överflöd av bilder.
Närvaro av meningslösa fraser och brist på logik
Språkvetaren Noam Chomsky noterar i sin bok Syntactic Structures att den grammatiskt korrekta konstruktionen av fraser i en mening inte garanterar närvaron av logik och mening. Som ett exempel nämnde experten frasen färglösa gröna idéer sover rasande - "färglösa gröna idéer sover rasande."
Algoritmer hjälper det neurala nätverket att bygga korrekta meningar vad gäller grammatik. Men för AI finns det inget begrepp om "mening". Och det kan ha sin egen logik för varje stycke, eftersom materialet hämtas från olika källor.
Till exempel ombads ett neuralt nätverk att generera recensioner för en duschtvål och träningsoverall. Texten om kläder blev så här: "Med hjälp av en kostym kan du koppla av, fördjupa dig i sportens värld och även gå en promenad. Den har temperaturkontroll, tack vare vilken du känner dig bekväm i alla situationer.
Och här är en recension om duschgelén: “Underbar gel, läcker inte, tynger inte ner huden. Förpackad i en påse, i en låda, med lock. Du behöver inte vänta på något extra så att det smulas sönder lite. Kan användas som nattduschgel.
Några fraser i dem välbyggd, men verkar samtidigt absurt och likna Chomskys illustration.
Brist på textur och ytliga exempel
Artificiell intelligens ger uppenbar information i texterna, allmänna fakta, använder strömlinjeformade fraser och exempel som inte avslöjar frågan så mycket. I det här fallet spelar ämnets komplexitet ingen roll. Frågan kan vara djup, som utvecklingsutsikter inneslutningar i Ryssland. Eller mer enkelt och individuellt, vad gäller val av teknik.
I texten om inkludering berättade det neurala nätverket hur viktigt och relevant detta ämne är. Hon tillade också att inkludering är en lång process, åtföljd av svårigheter, men det pågår ett arbete för att skapa förutsättningar för människor med särskilda behov. Och sammanfattat: om du inte slutar, kommer utvecklingen säkert att vara det.
Det som står svarar dock inte på frågan. Det är viktigt att texten är specifik. Du kan till exempel analysera vilka av de antagna lagarna som fungerar och vilka som inte gör det, och varför. För att avslöja utländska erfarenheter. Och förklara vilka konkreta åtgärder staten, näringslivet och varje person fortfarande kan ta för att utveckla inkludering.
I texten om köpa en smartphonesom genereras av det neurala nätverket, anges också de uppenbara urvalsfaktorerna. Till exempel: du bör bestämma operativsystem (iOS eller Android), varumärke, läsa recensioner och tekniska specifikationer, och även ta hänsyn till dina egna möjligheter.
1 / 0
2 / 0
Men folk förstår detta. En annan sak är att prata om chipsen i operativsystem, för att indikera de begränsningar som finns för tillfället. Eller nämn innovativa lösningar – till exempel eSIM-teknik, som gör att du kan ha upp till fem nummer i en smartphone. Eller dela överprissatta enhetsmodeller och deras motsvarigheter till bästa pris.
Förvrängning av fakta, tillägg av påhittad information
Det neurala nätverket svarar troligtvis på nästan alla frågor och ger en krönika, datum, efternamn, ursprungshistoria. I det här fallet är informationen förvrängd eller helt påhittad. En sådan bugg i AI-arbetet kallas hallucination.
Så det neurala nätverket fick i uppgift att berätta om de berömda döva människorsom gjorde en stor insats till samhällets utveckling. Som ett resultat uppfann AI de flesta av dem.
1 / 0
2 / 0
Till exempel astronauten Raymond Lou eller boxaren Mario Gallegos. Och USA: s 42:e president var fortfarande inte Matthew Clinton, utan Bill Clinton. Och han tappade inte hörseln.
Dessutom svarade AI självsäkert på begäran "skriv ett inlägg om kreativt amnesi». Även om det inte finns någon sådan term.
På frågan om varför boten hittar på människor och pratar om icke-existerande termer ber han bara om ursäkt för eventuell förvirring.
1 / 0
2 / 0
När falska fakta är sammanflätade med sanna data är det svårare att upptäcka neurala nätverkshallucinationer. Särskilt när flytande läsning. Men om du koncentrerar dig på exemplen i texten kan du lägga märke till de som ser misstänksamma ut och kontrollera dem genom att skriva in dem i sökfältet.
Brist på aktuell information om aktuella förändringar, händelser
Neurala nätverk lär sig själv när de kommunicerar med användare, kommer ihåg en persons förtydliganden, hans reaktion på det genererade innehållet, exempel som en person delar med en bot. Experter noteradeatt AI: s förmåga att lära sig själv kom som en överraskning för dem. Och att denna färdighet hjälper neurala nätverk att förbättras.
Vart i maskininlärning, utförd av utvecklare på gigabyte data - artiklar, böcker, texter från webben - har en tydlig början och slut. Och i princip har neurala nätverk inte tillgång till sökmotorer. Därför är informationen som dök upp efter utbildningen som genomfördes av utvecklarna inte tillgänglig för AI förrän nästa steg.
Samtidigt är intervallet mellan maskininlärning månader, och ibland år. Naturligtvis står framstegen inte stilla: till exempel i maj i år blev GPT Plus tillgängligt för användare med en betalprenumeration ChatGPT med tillgång till internet. Men de flesta neurala nätverk, särskilt deras gratisversioner, har ännu inte en sådan möjlighet.
Så basen för gratisversionen av ChatGPT4 är begränsad till 2021, så boten vet inte vem som vann det senaste världsmästerskapet 2022. Och Googles neurala nätverk - Bard AI - medgav att det inte kunde skriva en text om viktiga händelser som ägde rum i världen i somras.
1 / 0
2 / 0
Sedan hennes senaste utbildning genomfördes av utvecklarna i maj 2023 har sommaren ännu inte kommit för Bard AI.
I sådana fall kommer neurala nätverk vanligtvis inte med fakta, men erkänner att de inte kan "förutspå framtiden».
Om texten inte innehåller aktuell information om ämnet eller om den ser skild från verkligheten, eftersom mycket har förändrats nyligen, finns det en möjlighet att materialet skrevs av ett neuralt nätverk.
Vilka tjänster kan hjälpa
Texten som genereras av artificiell intelligens kan också kännas igen med hjälp av själva neurala nätverket. Det kan till exempel bot GPT-4. Specialtjänster som kan upptäcka AI-algoritmer kan också hjälpa. Låt oss titta på några av dem nedan.
- Text.ru. Webbplatsen är placerad som ett utbyte för copywriting och anti-plagiat. Men nyligen dök en betald neuroassistent upp på portalen. En av dess funktioner är en AI-detektor. Texten som ska kontrolleras ska laddas i fönstret. Efter några sekunder kommer systemet att ge resultatet.
- PR CY. Du kan ladda upp texter från 1 000 tecken till tjänsten. Samtidigt finns det förtydliganden på portalen: lågkvalitativa, spammade alternativ som en person skrev, kommer systemet att betrakta som ett resultat av AI-arbete. Samt texter med ljusa stilistiska färger - till exempel liknar verk Majakovskij.
- GPTZero. Verktyget läser av komplexiteten, kombinationen av ord, struktur och längd på meningar. Men om tjänsten klarar texter på engelska bra, ger den ofta ett fel när man laddar ryskspråkigt material. Av fördelarna - närvaron av en gratisversion.
Ett neuralt nätverk kan vara en stor hjälpare. Till exempel när man letar efter idéer. Att helt lita på hennes innehåll är dock farligt. Du bör behandla AI-material på ett ansvarsfullt sätt: redigera skräppost, kontrollera korrekthet, logik och relevans av fakta. Och anpassa stilen till det "mänskliga" språket, för att inte skrämma publiken, spara företagets rykte och position i sökresultaten.
Läs också🤖
- 6 skäl till varför du inte ska lita blint på artificiell intelligens
- Hur man lägger till en bot i Discord
- 6 neurala nätverk för att skapa logotyper