,

Oprydning med fantastiske Excel og ChatGPT

Oprydning med fantastiske Excel og ChatGPT

Overblik over oprydning i slægtsdata

Oprydning med fantastiske Excel og ChatGPT

I forbindelse med den omsiggribende oprydning i slægtsdatabasen fik jeg idéen om, at det ville være vældig nyttigt at markere hvilke af de 841 gennemgåede personer, der er direkte aner i begge mine familier (adoptivfamilien og den biologiske familie).

Jeg har en Excelfil, hvor jeg i store træk noterer, hvad jeg har foretaget med den enkelte. Nogen videnskab er det selvfølgelig ikke.

Nogle få personer fra begge slægter kan jeg selvfølgelig genkende bare ved at løbe ned over rækkerne, men det er langt fra præcist.

Herunder er lidt af, hvad jeg gik igennem, før det lykkedes

Jeg ved, at mindst én af mine læsere ville kunne gøre det meget smartere 🙂 – men jeg kan desværre ikke skrive makroer, og ChatGPT kunne heller ikke få det til at lykkes trods mange forsøg. Så jeg gjorde det på “husmandsmåden”, og virkede det.

Udfordring 1: Få Legacy til at lave et udtræk med begge slægter vha. Fokusgruppe

Anne Marie Holck fra Legacys forum hjalp med at få dannet et udtræk, der viser direkte aner i begge slægter. Problemet opstod, fordi jeg forsøgte med en makro, der ikke resulterede i noget … Problemet var, at kildedata var mere end mangelfulde. Der kom slet ikke de personer med i udtrækket, jeg forventede. Det var hurtigt og nemt at se, at hverken mine “mormødre” eller “morfædre” var med i udtrækket.

Så jeg lærte om fokusgrupper, der er en genial funktion – især når man har flere familier. Prøv evt. selv:

  1. Gå til “Søg”
  2. Vælg “Forskelligt”
  3. Indstil hvem der skal være udgangspunktet.
  4. Vælg “Fokusgruppe”
  5. Indstil som vist
  6. Bemærk det nederste flueben “Inkluder flere forældre (hvis tilknyttet mere end et par)”. Det var lige det, der skulle bruges
  7. Vælg “Lav liste”
  8. Tryk “Valg”. Vælg “Udskriv” til en kommasepareret fil

Oprydning med fantastiske Excel og ChatGPT

Udfordring 2: Den kommaseparerede fil skal bearbejdes lidt

Filen, Legacy danner, vil se ud nogenlunde som nedenstående. Problemet er, at ID-nummeret (Legacy kalder det for RIN), står i samme felt som navnet. Vi skal kun bruge selve tallet for at komme videre.

Oprydning med fantastiske Excel og ChatGPT

Men det er ikke et reelt problem, for det klarer Excel som en mis. Denne formel trækker tallet ud og placerer det i fx celle B1:

=VENSTRE(A1; FIND(“,”; A1) – 1)

Stå i celle B1. Kopier formlen ind og straks har du noget, der ligner nedenstående:

Oprydning med fantastiske Excel og ChatGPT

  • Det vil sige, at nu har jeg nogle tal/RIN/ID’er, jeg kan sammenligne med tallene fra mit oprindelige store regneark.
  • Alle de tal, der findes i denne lille fil, kan sammenlignes med tallene i det store ark.
  • Hvis tallet findes begge steder, er der tale om en direkte ane fra en af slægterne.
Udfordring 3: Resultatløs tilpasning af det oprindelige ark

Jeg prøvede først med en makro, som ChatGPT skrev for mig, da jeg som nævnt ikke kan skrive makroer/VBA-kode, og min hjerne egner sig ikke til at lære det.

Robotten har været en kæmpe hjælp, idet jeg aldrig giver op overfor uløste problemer. Jeg er parat til betalingsudgaven (GTP-3 Plus eller GPT-4) efter dette. Jeg har brugt lang tid på opgaven, men jeg har sparet oceaner af tid i forhold til den tid, jeg skulle have brugt med Google.

Robotten skal vide, hvad man vil opnå. Man må fortælle, hvad man har i de forskellige kolonner og på to sekunder spytter den et forslag ud. Det er helt vildt. Det havde jeg ikke kunnet Google mig til, for med Google skal man jo fx vide, hvad funktionen hedder for at kunne søge efter den. Det finder ChatGPT selv ud af, når den ved, hvad man vil opnå og hvordan data ser ud.

“Vi” kunne ikke få det til at fungere med makroen. ChatGPT foreslog i stedet LOPSLAG og leverede en formel, men det lykkedes ikke. LOPSLAG er “bundet af”, at den værdi, man vil kigge efter, skal stå i første kolonne. 

Først prøvede jeg at sætte ID-numrene i forreste kolonne, så prøvede jeg med “Ja”, der fortæller mig, at her er en direkte ane. Lige meget hjalp det. Pludselig ville Excel overhovedet ingenting – ikke engang lægge to tal sammen. Det var helt ligegyldigt, hvor hvad stod. “Vi” måtte finde på noget andet.

Udfordring 4: ChatGPT foreslog INDEKS og SAMMENLIGN

Jeg har ofte læst om styrken ved de to funktioner i kombination men har syntes, det så indviklet ud. Nu fandt jeg tilbage til en af Kasper Langmanns (Proximo) videoer på YouTube. Han er god til at forklare og splitte opgaven op i trin, så man forstår, hvad man foretager sig. Det er ikke bare “copy and paste”.

Efter bare fem minutter havde jeg denne formel, som er græsk katolsk overfor, hvilke kolonner data befinder sig i.

=INDEKS(A:A;SAMMENLIGN(G24;B:B;0))

  • Sammenhold evt. disse punkter med det nederste billede, men det kan være svært at se
  • I kolonne A har jeg (helt dumt – men det virker) skrevet “Ja” ud for de 592 direkte aner
  • I kolonne B har jeg numrene på de 592 direkte aner. Numrene stammer fra =VENSTRE(A1; FIND(“,”; A1) – 1) i csv-filen, og som jeg bare har kopieret ind i den store fil.
  • Fx indeholder celle G24 nummer “995”, som er min mormors fars ID.
  • Kolonne H er som udgangspunkt tom. Den skal fodres med “Ja”, der hentes fra kolonne A.
  • Og helt lavpraktisk kigger funktionen så ovre i kolonne B for at se, om den også kan finde “995” der.
  • Hurra det kan den, og så returnerer den et “Ja” i kolonne H.

Så er der selvfølgelig “problemet” med, at alle de personer, der ikke findes begge steder (fordi de ikke er direkte aner).

Hvis jeg var bedre, end jeg er, kunne Excels returnering af #I/T sikkert være løst smartere. “Koden” vises, når der ikke er et match. Jeg lavede bare på to minutter lidt sortering frem og tilbage og slettede alle #I/T’erne. Det virkede strålende.

Og da de alligevel var sorterede, gav jeg dem lidt kulør. Og bagefter sorterede dem tilbage til den oprindelige dato for gennemgang, så jeg ikke mister det forkromede overblik, jeg endelig har fået.

Udfordring 5: Tænk hvis jeg kunne huske, hvorfor jeg ville markere de direkte aner

Jeg kan simpelthen ikke huske, hvad det var, der fik idéen om denne markering til at opstå. Men det må da være smart?

Da jeg fik idéen, besluttede jeg, at den var værd at bruge tid på. Og så har jeg lært en masse og jeg elsker læreprocesserne.

Oprydning med fantastiske Excel og ChatGPT


Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Jeg svarer dig også relation til artiklen, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder meget kort. Herefter vil du stryge lige igennem.

,

“Bedre kilde” og “Bedre tydning”

"Bedre kilde" og "Bedre tydning"

Rygklapperi og fra Adelgade, Trinitatis, til Horsens

“Bedre kilde” og “Bedre tydning”

"Bedre kilde" og "Bedre tydning"

Advarsel: Denne artikel indeholder lidt “praktisk nørderi”.

Jeg har lavet et regneark, hvor jeg kan registrere data fra oprydningen.

Det hjælper med overblik over, hvad jeg har foretaget mig med hver person og hvor langt jeg i det hele taget er nået. Det er også nyttigt for ikke at fare vild: “Hvem kom jeg nu fra?”, når man har bevæget sig et stykke op eller ned.

Da jeg havde gennemgået de første ca. 100 personer, havde jeg et ret godt billede af hvilke data, der var brug for. Det er sjældent, der er behov for nye.

Billedet til højre viser et udpluk af listen. Den reelle liste (fx med alle folketællingerne) med forklaringer til forkortelserne er vist nederst i denne artikel.

Det er jo ingen videnskab, og der er helt sikkert inkonsistens i, hvordan jeg bruger dem. Fx kunne der helt sikkert stå fejlrettelse adskillige steder; men sådan kan man blive klogere.

Gennem et stykke tid har jeg alligevel tænkt på, at der manglede to:

  • “Bedre kilde”.
    • Jeg gider ikke opdatere alle de gamle henvisninger til mikrokortene.
    • Vil andre kigge mig i (mikro-)kortene, må de selv slå efter; men af og til er det fordelagtigt for mig selv, og så opdaterer jeg kilden.
  • “Bedre tydning”. Den er der af naturlige årsager i høj grad behov for. Det er jo det, der gør det sjovt, og det der gør, at jeg bliver klogere og finder nye sammenhænge. Men det er også det, der tager tid.
  • Nu skal jeg jo heldigvis ikke stå til regnskab for mit tidsforbrug og min produktivitet overfor en chef eller andre, men af og til tænker jeg over, hvorfor jeg kun har registreret at have færdiggjort fem personer på en dag. Det er måske fordi, jeg har bikset med tydninger fra fx Trinitatis eller Helliggeist? Så man kan sige, at jeg bare klapper mig selv lidt på ryggen, altså ren og skær rygklapperi.
  • Men altså ville jeg oprette to nye.

Området for datavalidering

Det er en makro, der sørger for, at rullelisten/dropdownlisten fungerer. Jeg har tidligere uden problemer lavet ændringer i listen, men jeg kunne simpelthen ikke få de to nye “Bedre kilde” og “Bedre tydning” (som selvfølgelig er en fejlrettelse …) til at fungere. De ville bare ikke blive vist i dropdownlisten.

Jeg spurgte en ven, der – i modsætning til mig – er meget dygtig til makroer og VBA, og jeg spurgte ChatGPT i flere omgange. Og det endte såmænd med, at det var ChatGPT, der kom med løsningen: Det område, som dropdownlisten henter sine data fra, var forkert. Så banalt var det. Det var datavalideringen, der var forkert.

Når det ikke uden videre lykkedes denne gang, skyldtes det, at jeg havde indsat de to felter for oven, dvs. udvidet området. De andre gange, jeg har rettet i listen, har jeg indsat noget inde i det område, der allerede var defineret. Og det registrerer Excel ganske af sig selv.

"Bedre kilde" og "Bedre tydning"

Og fra Adelgade i Trinitatis Sogn til Horsens i Nim Herred

Af og til kan MyHeritage noget – ikke via brugernes data men via deres originale kilder.

Rasmus Hansen WENTZEL er en 4 * tipoldefar (grafisk fremstilling af slægtskabet her – og hvis du klikker på en person, kommer du til hans/hendes egne data) og det er fra ham al morskaben med Adelgade og Trinitatis stammer. Han er far til Danmarks største slavehandler Jens Adolph KIØGE, så ham/dem gør jeg af naturlige årsager mere ud af.

Jeg synes, først personerne er rigtig “færdige”, hvis de har en dødsdato, når de er født i 1700- eller 1800-tallet, så jeg besluttede at se, om MyHeritage kunne byde på noget. De sagde: “Død i Horsens”, og jeg sagde højt ud i rummet til mig selv “Nej, nu må I altså stoppe”, men der var en henvisning til en original kilde, så jeg tjekkede. Og det var sandt!

Anmærkningerne kunne fortælle, at han var død hos en svigersøn Sandberg. Kilde: Skanderborg Amt, Nim, Horsens – Vor Frelser, 1829-1846, KM, Døde mænd – opslag: 6 af 26 opslag.

Folketællingen 1834 kunne fortælle, at Adolphine Helene WENTZEL var enke efter SANDBERG; og han var helt korrekt død som Told- og Konsumptionsbetjent efter svigerfaderen men før folketællingen 1834. Og i øvrigt var han gift med Adolphine Helene i Holmen Sogn i 1816. Også der var han Told- og Konsumptionsbetjent.

Og så passede pengene. Det kunne ikke være bedre. Den aften gjorde MyHeritage sig fortjent til sine skyhøje priser. Jeg havde da aldrig drømt om at lede i Horsens efter en mand fra Adelgade i Trinitatis.

Nu forestår at finde 4 * tipoldemor Karen KIØGE død  (vel i Adelgade, Trinitatis?) …

Data til rulleliste/dropdown

Evt. forklaring til rulleliste/dropdown

Bedre kilde  
Bedre tydning  
Begr. Begravelse
Begr.sted Kirkegård
Besk. Beskæftigelse
Bopæl  
Data kunne ej verificeres -> slettet  
Dsted Dødssted
Dåb  
Dåb ikke fundet  
Død  
Død ej fundet  
Dødsattest  
Dødsårsag  
Enavn Efternavn
Fadd. Faddere
Fader Far
Fejlrettelse  
Fmåned Født måned
Fnavn Fornavn
Forskningsnote  
Fsted Født sted
Flere FT Adskillige nye folketællinger
FT 1771  
FT 1787  
FT 1801  
FT 1834  
FT 1840  
FT 1845  
FT 1850  
FT 1855  
FT 1860  
FT 1870  
FT 1880  
FT 1885  
FT 1890  
FT 1901  
FT 1906  
FT 1911  
FT 1916  
FT 1921  
FT 1925  
FT 1930  
FT 1940  
Får Fødselsår
Generel note  
Gravsten  
Img. Billede
Introd. Introduceret dato
Irrelevant person-> Slettet  
Konf. Konfirmeret
Konf. ikke fundet Konfirmation ikke fundet
Lysning Lysning til ægteskab
Medicinsk note  
Medicolegal Ligsynsattest  
Moder Mor
Navneændring  
Opgives Der skal ikke gøres mere. Bruges, hvis noget er fundet, og der ikke kan findes mere.
Politiets Registerblade  
Skifteattest dato Typisk foruds. for nyt ægteskab
Skilsmisse  
Statstidende tjekket for død  
Trolovelse  
Vacc. Vaccination
Vielse  
Vielser  
Ægtefælle tilføjet  
,

Fra gift i februar til Gigtfeber

Fra gift i februar til Gigtfeber

Gotisk skriftlæsning er en træningssag

Fra gift i februar til Gigtfeber

Det vanvittige projekt er til tider virkelig sjovt, og Trinitatis kirkebog (Sokkelund Herred) er vanskelig.

Jeg rydder op til den store guldmedalje, og til tider morer jeg mig storartet over mine gamle fejl; behovet for oprydning er tydeligt. Det er også tydeligt, at gotisk skriftlæsning er en træningssag. Hvor er der dog mange husmænd, jeg har gjort til gårdmænd, fordi jeg ikke kunne se forskel på et gotisk H og G. Og det kan af og til stadig drille.

I perioder, hvor jeg har været lidt borte fra genealogien, har jeg også kunnet mærke, at jeg lige skulle “ind i rytmen igen”.

En 4*tipoldefar var gift tre gange – og jeg havde noteret, at de var gift i februar (underforstået 1770). Andet stod der ikke, og det lever slet ikke op til mine nuværende kvalitetskrav. Men hvor kom det fra?

Fra gift i februar til GigtfeberDet stammede fra hans første hustrus død den 4. maj 1770, så det var et kortvarigt ægteskab, men jeg kunne ikke finde vielsen i Trinitatis. Så jeg måtte tilbage til udgangspunktet: hendes død. Det viste sig, at der stod “Gigt.Feber” som dødsårsag 🙂 Der er immervæk en forskel.

Når jeg ser på det igen, bliver jeg faktisk i tvivl, om det overhovedet er rigtigt. Klikker du på billedet, kommer du til kirkebogen:

  1. Gigtfeber er i et ord.
  2. Hvad laver det punktum der? Det sættes normalt for at vise, at der er tale om en forkortelse. Det passer ikke med “Gigt.Feber”.
  3. Ligner det ikke meget mere “st” foran punktummet?

Nuvel, jeg synes, Trinitatis er svær, for der blev sparet på papiret. Det er ikke en kirkebog, man nemt får overblik over. Jeg tilgiver mig selv, at jeg i 2007 læste det som “Gift Februar”.

Som billedet viser, er der tale om en af de meddelsomme præster, der fortæller dødsårsagen for hver eneste person. Det viser også et udvalg af, hvad man nemt døde af i 1770: Brystsyge, Colik, Gigtfeber(?), Kopper, Slag og Tæring.

En lang trolovelse (ca. 10 år)

En enkelt tastefejl i et årstal bevirkede, at trolovelsen var i 1741 og vielsen i 1751. Den slags er rart at få korrigeret. Der skal meget lidt til, før resultatet bliver noget frygteligt vrøvl.

Jeg er udmærket klar over, at jeg ikke fanger alt; det bliver ikke perfekt, men det bliver meget bedre. Og det er fantastisk så mange detaljer, der nu kan tilføjes fra originale kilder hjemme ved skrivebordet. Der er sket meget på 20 år.

Andre detaljer

Fra gift i februar til Gigtfeber

  • Nu, hvor tiden er til det, tilføjer jeg også mere end en beskæftigelse for at vise livets op- og nedture. Af og til er der ingen ændringer: en indsidder forblev indsidder. Andre gange startede han som gårdmand og endte som indsidder. Altså en social deroute. Kan de forskellige kilder fortælle om årsagen? Eller omvendt: Han starter som indsidder og arbejder sig op til enten husmand eller måske helt til gårdmand. Den slags, synes jeg, er spændende, for det fortæller en historie om et menneske.
  • Jeg har modtaget mange transskriptioner og har været meget glad for dem. Jeg tjekker dem for at se, om jeg er enig. Og det gælder ikke altid. Jeg foretrækker kildetro transskriptioner, hvorefter det er op til brugeren (evt. mig selv) at fortolke dem. Som eksempel skal store bogstaver være store, og “Peders Dat.” skal ikke blive til “Pedersdatter”. Det er ikke kildetro.

Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Jeg svarer dig også relation til artiklen, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder meget kort. Herefter vil du stryge lige igennem.

, ,

Sprogdatabasen for juli 2023

Sprogdatabasen for juli 2023

Kortere kan det ikke siges

Sprogdatabasen for juli 2023

Af naturlige eller unaturlige (vælg selv) årsager er sprogdatabasen denne gang uhyre kortfattet. Jeg har ikke haft hverken kræfter eller teknologi til at følge så godt med på de sociale medier, som jeg plejer. Tingene – især billedbehandlingen – er sværere på en iPad.

Det betyder, at der kun er poster efter min udskrivelse og at jeg stort set kun har fanget Danmarks Radio og (andre) professionelle. Til gengæld får du denne gang flere billeder, der dokumenterer mine påstande om det, man skulle tro var “løwn”.

Jeg vender tilbage om en måned. Udgivelsestidspunktet ændres samtidigt til den 1. i hver måned kl. 12:00.

Databasen har du som altid her.


1. “I henhold til fødevarestyrelsens påbud må vi ikke opbevarer privat indkøbt mad og is i fryseren”. Professionelle bør vide, at navne på offentlige myndigheder skal med stort, og de bør også vide, at “løber-reglen” hjælper med at finde ud af, om der skal nutids-r på eller ej.

2. Her mangler korrekturlæsningen. Danmarks Radio i forbindelse med drabet på Brøndbyøstervej: “Der er også mulighed for, at vores medarbejde kan få krisehjælp af psykologer”.

3. Dette er bare almindeligt sjusk: “Vi spurte pænt om de ville skue ned for musikken”. Man skuer næsten en massespurt i årets Tour de France.

4. Danmarks Radio den 22. juli 2023: “Hospitaler sender gravide hjem med fødsel-spiller i hånden”. Det drejer sig om medikamentet “Angus” og ikke en eller anden landsholdsspiller. Jeg undrer mig til stadighed over, at et så stort medie og flagskib ikke kan finde lidt håndører til software, der kan håndtere orddelingen.

Sprogdatabasen for juli 2023

5. Den 23. juli 2023: Vi tager lige en omgang Danmarks Radio og orddeling mere: “Organisationer efter nyt kni-voverfald i psykiatrien …”

Sprogdatabasen for juli 2023

6. Flinke folk: Et firma “Sleep2care.dk” forærer varerne væk: “Bestil i dag og modtag gratis varen ved hovedføren i morgen!”. Mon ikke der skulle have stået noget om, at det var fragten til hoveddøren, der var gratis?

7. Endnu en god grund til ikke at tænde for TV2. Jeg vil gerne have mig frabedt at blive “håndteret”, idet jeg trods alt ikke er en genstand men et menneske: “Siden 2012 har en række medarbejdere, som håndterer psykiatriske patienter, mistet livet på arbejdet”.

Sprogdatabasen for juli 2023

8. Jeg abonnerer ikke selv på nogen former for konspirationsteori, men det er der muligvis andre, der gør: “Høring om UFOer i Kongressen”. Meningen havde været mere retvisende, hvis der fx havde stået “Høring i Kongressen om UFOer”.

Sprogdatabasen for juli 2023

9. Tænk at en virksomhed som nemlig dot com ikke kan finde penge til en korrekturlæser: “Få virksomhedens daglivarer leveret lige til døren”. Der er selvfølgelig den mulighed, at de selv synes, det ser smart ud/lyder smart. Det gør jeg ikke!Sprogdatabasen for juli 2023

 

10. Her er både lydskrift og almindeligt sjusk. Man kan ikke høre forskel på “sagn” og “savn”, som der burde have stået: “Jeg har ikke set min far i ca 20 år og inderst indehar jeg haft et sagn til en far og en faderfigur”.

11. Mange har svært ved orddeling og er ikke klar over, at man af og til skal gøre det manuelt for at få det rette resultat. Hvorfor læser folk ikke, hvad de skriver? Manuel orddeling kan ofte ske ved hjælp af tasterne CTRL + Shift + Enter samtidigt: “Her kan du finde Psykiatrifondens kontak-toplysninger”.

Sprogdatabasen for juli 2023

12. Det er sjusk og manglende brug af stavekontrollen: “Vi holdt så meget af sejlturerne i sin tid”.


Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Jeg svarer dig også relation til artiklen, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder meget kort. Herefter vil du stryge lige igennem.