Oprydning med fantastiske Excel og ChatGPT
Overblik over oprydning i slægtsdata
Oprydning med fantastiske Excel og ChatGPT
I forbindelse med den omsiggribende oprydning i slægtsdatabasen fik jeg idéen om, at det ville være vældig nyttigt at markere hvilke af de 841 gennemgåede personer, der er direkte aner i begge mine familier (adoptivfamilien og den biologiske familie).
Jeg har en Excelfil, hvor jeg i store træk noterer, hvad jeg har foretaget med den enkelte. Nogen videnskab er det selvfølgelig ikke.
Nogle få personer fra begge slægter kan jeg selvfølgelig genkende bare ved at løbe ned over rækkerne, men det er langt fra præcist.
Herunder er lidt af, hvad jeg gik igennem, før det lykkedes
Jeg ved, at mindst én af mine læsere ville kunne gøre det meget smartere 🙂 – men jeg kan desværre ikke skrive makroer, og ChatGPT kunne heller ikke få det til at lykkes trods mange forsøg. Så jeg gjorde det på “husmandsmåden”, og så virkede det.
Udfordring 1: Få Legacy til at lave et udtræk med begge slægter vha. Fokusgruppe
Anne Marie Holck fra Legacys forum hjalp med at få dannet et udtræk, der viser direkte aner i begge slægter. Problemet opstod, fordi jeg forsøgte med en makro, der ikke resulterede i noget … Problemet var, at kildedata var mere end mangelfulde. Der kom slet ikke de personer med i udtrækket, jeg forventede. Det var hurtigt og nemt at se, at hverken mine “mormødre” eller “morfædre” var med i udtrækket.
Så jeg lærte om fokusgrupper, der er en genial funktion – især når man har flere familier. Prøv evt. selv:
- Gå til “Søg”
- Vælg “Forskelligt”
- Indstil hvem der skal være udgangspunktet.
- Vælg “Fokusgruppe”
- Indstil som vist
- Bemærk det nederste flueben “Inkluder flere forældre (hvis tilknyttet mere end et par)”. Det var lige det, der skulle bruges
- Vælg “Lav liste”
- Tryk “Valg”. Vælg “Udskriv” til en kommasepareret fil
Udfordring 2: Den kommaseparerede fil skal bearbejdes lidt
Filen, Legacy danner, vil se ud nogenlunde som nedenstående. Problemet er, at ID-nummeret (Legacy kalder det for RIN), står i samme felt som navnet. Vi skal kun bruge selve tallet for at komme videre.
Men det er ikke et reelt problem, for det klarer Excel som en mis. Denne formel trækker tallet ud og placerer det i fx celle B1:
=VENSTRE(A1; FIND(“,”; A1) – 1)
Stå i celle B1. Kopier formlen ind og straks har du noget, der ligner nedenstående:
- Det vil sige, at nu har jeg nogle tal/RIN/ID’er, jeg kan sammenligne med tallene fra mit oprindelige store regneark.
- Alle de tal, der findes i denne lille fil, kan sammenlignes med tallene i det store ark.
- Hvis tallet findes begge steder, er der tale om en direkte ane fra en af slægterne.
Udfordring 3: Resultatløs tilpasning af det oprindelige ark
Jeg prøvede først med en makro, som ChatGPT skrev for mig, da jeg som nævnt ikke kan skrive makroer/VBA-kode, og min hjerne egner sig ikke til at lære det.
Robotten har været en kæmpe hjælp, idet jeg aldrig giver op overfor uløste problemer. Jeg er parat til betalingsudgaven (GTP-3 Plus eller GPT-4) efter dette. Jeg har brugt lang tid på opgaven, men jeg har sparet oceaner af tid i forhold til den tid, jeg skulle have brugt med Google.
Robotten skal vide, hvad man vil opnå. Man må fortælle, hvad man har i de forskellige kolonner og på to sekunder spytter den et forslag ud. Det er helt vildt. Det havde jeg ikke kunnet Google mig til, for med Google skal man jo fx vide, hvad funktionen hedder for at kunne søge efter den. Det finder ChatGPT selv ud af, når den ved, hvad man vil opnå og hvordan data ser ud.
“Vi” kunne ikke få det til at fungere med makroen. ChatGPT foreslog i stedet LOPSLAG og leverede en formel, men det lykkedes ikke. LOPSLAG er “bundet af”, at den værdi, man vil kigge efter, skal stå i første kolonne.
Først prøvede jeg at sætte ID-numrene i forreste kolonne, så prøvede jeg med “Ja”, der fortæller mig, at her er en direkte ane. Lige meget hjalp det. Pludselig ville Excel overhovedet ingenting – ikke engang lægge to tal sammen. Det var helt ligegyldigt, hvor hvad stod. “Vi” måtte finde på noget andet.
Udfordring 4: ChatGPT foreslog INDEKS og SAMMENLIGN
Jeg har ofte læst om styrken ved de to funktioner i kombination men har syntes, det så indviklet ud. Nu fandt jeg tilbage til en af Kasper Langmanns (Proximo) videoer på YouTube. Han er god til at forklare og splitte opgaven op i trin, så man forstår, hvad man foretager sig. Det er ikke bare “copy and paste”.
Efter bare fem minutter havde jeg denne formel, som er græsk katolsk overfor, hvilke kolonner data befinder sig i.
=INDEKS(A:A;SAMMENLIGN(G24;B:B;0))
- Sammenhold evt. disse punkter med det nederste billede, men det kan være svært at se
- I kolonne A har jeg (helt dumt – men det virker) skrevet “Ja” ud for de 592 direkte aner
- I kolonne B har jeg numrene på de 592 direkte aner. Numrene stammer fra =VENSTRE(A1; FIND(“,”; A1) – 1) i csv-filen, og som jeg bare har kopieret ind i den store fil.
- Fx indeholder celle G24 nummer “995”, som er min mormors fars ID.
- Kolonne H er som udgangspunkt tom. Den skal fodres med “Ja”, der hentes fra kolonne A.
- Og helt lavpraktisk kigger funktionen så ovre i kolonne B for at se, om den også kan finde “995” der.
- Hurra det kan den, og så returnerer den et “Ja” i kolonne H.
Så er der selvfølgelig “problemet” med, at alle de personer, der ikke findes begge steder (fordi de ikke er direkte aner).
Hvis jeg var bedre, end jeg er, kunne Excels returnering af #I/T sikkert være løst smartere. “Koden” vises, når der ikke er et match. Jeg lavede bare på to minutter lidt sortering frem og tilbage og slettede alle #I/T’erne. Det virkede strålende.
Og da de alligevel var sorterede, gav jeg dem lidt kulør. Og bagefter sorterede dem tilbage til den oprindelige dato for gennemgang, så jeg ikke mister det forkromede overblik, jeg endelig har fået.
Udfordring 5: Tænk hvis jeg kunne huske, hvorfor jeg ville markere de direkte aner
Jeg kan simpelthen ikke huske, hvad det var, der fik idéen om denne markering til at opstå. Men det må da være smart?
Da jeg fik idéen, besluttede jeg, at den var værd at bruge tid på. Og så har jeg lært en masse og jeg elsker læreprocesserne.