,

“Projekt Oprydning” bevæger sig langsomt, for nye interessante emner dukker op

En tidsrejse

“Projekt Oprydning” begyndte som en simpel fejlretning, men har udviklet sig til en egentlig tidsrejse gennem både slægten og slægtsforskningens metoder. Undervejs opstår nye spor, gamle data driller – og pludselig nærmer slutdatoen sig for første gang.

“Projekt Oprydning” bevæger sig langsomt, for nye interessante emner dukker op

(Topbilledet har intet med dagens emne at gøre. Det stammer fra gårsdagens tur væk fra skærmen og ned til Rebæk Sø. Jeg kan så godt lide gæssene).

Jeg bliver nemt afledt af emner, jeg også gerne vil have fokus på. Der må prioriteres benhårdt i min lille butik, når jeg også gerne vil lave podcast for Danske Slægtsforskere.

“Projekt oprydning” blev påbegyndt den 4. august 2022. Det gik oprindeligt “kun” ud på at finde gamle fejl i allerede eksisterende data. Det er med vilje, at “kun” er i citationstegn. Men som tiden er gået, drejer det sig nu om at:

  • finde dødsfald på mennesker, der helt sikkert ikke lever længere
  • finde de tidligere og senere ægtefæller, som data indikerer
  • prøve at opspore samtlige børn samt disses ægtefæller, men heller ikke flere
  • opdatere de gamle “arkivhenvisninger” som overhovedet ikke var til kilder, men fx til IGI (International Genealogical Index) og mikrokortene …
  • forfølge spændende gamle og nye indikationer, fx “han blev fradømt gården i 1801” – jamen hvorfor? Hvad lå bag? eller: “Han døde i Christianshavns Straffeanstalt “, nåh, men hvorfor det?

Det er som at gå fra “aneindsamling” til slægtsforskning.

Lige nu er status vist på grafen herunder – fordelt på år:

Når man roder rundt i data

Jeg kan ikke helt finde rundt i alle mine elskede data, for af en eller anden årsag passer de ikke sammen. Som tabellen viser, har jeg lige nu afsluttet 3.142 personer. Legacy viser, at jeg lige nu har 3.389 personer, ergo burde jeg kun mangle at gennemgå differencen på 247. Men når jeg laver en liste over de personer, der ikke har hashtagget #Oprydning, så er der 570. Og det er jo det rigtige antal.

Jeg tror, diskrepansen skyldes, at jeg i begyndelsen (dengang i 2022 …) også registrerede de irrelevante personer. Dem har jeg registreret 109 af. Det var mennesker, der gik længere end aners søskende med ægtefæller og deres børn, fx fordi i “gamle dage” kunne man kun slægtsforske derhjemme ved hjælp af indtastede folketællinger og en meget begrænset mængde kirkebøger. Var der en folketælling, inddrog jeg “revl og krat” – en masse mennesker, der ikke havde det ringeste med mig at gøre. Dem sletter jeg nu. Jeg vil tro, at jeg har slettet mellem 600 og 800, selvom det gjorde ondt hjertet.

Det vil så sige, at regnearket, der styrer projektet, rummer mennesker, som Legacy ikke længere rummer. Så skal det jo gå galt! Jeg sammenholder pærer med bananer. Heldigvis er det ingen videnskab, og det er godt, jeg ikke er ansat til dette her, så blev jeg nok fyret på gråt papir i går.

Forventede slutdatoer og nøgletal

Jeg fik min ven ChatGPT til at opdatere de forventede slutdatoer, og det er lige til at blive i godt humør af, for nu kan tidsrummet indsnævres til mellem den 25. maj og den 16. juni – altså en forskel på kun tre uger. 25. maj er ikke så realistisk, for det forudsætter, at jeg ikke inddrager nye personer. Det kan jeg selvfølgelig ikke garantere. Derimod inddrager estimatet den 16. juni den hidtidige profil for nye personer.

Der har været tidspunkter, hvor jeg troede, jeg aldrig blev færdig. Nu kan jeg faktisk se en ende på projektet, Det føles godt, for egl. gider jeg ikke mere. Jeg har fanget det, jeg har fanget. Det bliver aldrig perfekt, men jeg har gjort det, så godt jeg kunne.

I begyndelsen var det umuligt at sige, hvornår jeg blev færdig. Men efterhånden som datasættet er blevet gennemarbejdet, begyndte tallene at stabilisere sig – så og nu kan jeg faktisk estimere afslutningen inden for kun få uger.

Nøgletallene er vist i tabellen herunder, og de er egl. meget sjove, også selvom de ikke er præcise. De er ikke præcise, fordi jeg først efter noget tid fandt på fx at registrere adresseforespørgsler og civilstande. Dvs. de er ikke med fra begyndelsen – men igen: det er jo trods alt ingen videnskab, selvom det havde været rart, hvis jeg havde fået alle de nye idéer fra begyndelsen.

En tidsrejse

Jeg retter op på gamle dårlige “kildehenvisninger” som overhovedet ikke var kildehenvisninger/arkivhenvisninger. Det er som at blive sat 20 år tilbage i tid. Se fx disse to, hvor henvisninger går til det hedengangne IGI, til de ditto mikrokort og noten “Herudover er teksten stort set ulæselig”. Det var også dengang; nu er det ikke længere så galt. Dem har jeg en del af.

Det er nu meget sjovt at gense, for der er på mange måder løbet meget vand i stranden siden den 3. januar 2008.

Jeg fandt på min PC dette gamle IGI-hæfte, som du måske også har haft (og det kan i øvrigt findes på Danskerne historie Online. (Du kan også hente det ved at klikke på billedet.))

Det er næsten som at gå tilbage til en tid, hvor vi ristede runer, hvor det hed en datamat og edb (elektrisk databehandling) , og hvor man skulle spare op i tre måneder for at få råd til at tilkøbe lidt plads i form af en ekstern harddisk. Prøv at hente det og bladr lidt. Det er utroligt, hvad der er sket på de 25 år, siden hæftet udkom i 2. oplag i år 2000.

Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge. Jeg svarer dig også relation til artiklen til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder kort. Jeg svarer til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid. Herefter vil du stryge lige igennem.

,

Man kan hverken skynde sig at transskribere eller podcaste

Langsommelige processer

Man kan hverken skynde sig at transskribere eller podcaste

Transskribering og podcastproduktion har én ting til fælles: Man kan ikke forcere processen. Kvalitet opstår først, når man giver dig tid til at læse, lytte, rette – og begynde forfra.

Forleden talte jeg med en meget dygtig slægtsforsker, der sagde:

Man kan ikke skynde sig at transskribere. Det tager den tid det tager.

Det havde han fuldkommen ret i. Det tager den tid, det tager, og gør det ikke, så bliver det noget juks. Det er lige så afstressende at transskribere som at bladre i kirkebøger. Jeg kommer i flow og i en næsten tranceagtig tilstand, hvor jeg glemmer tid og sted og kun har øje for at læse eller bladre. Timerne går, og jeg opdager, at jeg da for resten ikke har fået noget mad i dag.

Jeg er længe om at transskribere, for jeg er blevet gjort opmærksom på, at jeg har de klassiske problemer med h, f og det lange s. Det er rigtig godt, for nu ved jeg, hvor jeg skal være på vagt. Altså må jeg prøve mig lidt frem med ordene, hvis det ikke uden videre fremgår af konteksten, hvad der skal stå.

Lige nu sidder jeg med Højesterets voteringsprotokol i sagen mod Christian Westermann, og selv om vi er højt oppe i hierarkiet, så følger de altså ikke de regler, der fremgår af hverken Kathrine Tobiasens “Håndskrifter  for slægtsforskere” eller Mette Fløjborgs “Gotisk – lær at læse og skrive gotisk”. Eksempelvis ligner a nærmest en slags g – og der står fx “Forhørerne”. Det er her, jeg ikke kan skynde mig.

FastStone Image Viewer

Af og til har jeg set andre slægtsforskere sætte en markering over ord eller linjer, men jeg har ikke været klar over, hvordan de bar sig ad. Nu har jeg endelig fundet det gratis og geniale program “FastStone Image Viewer”.

Har man en meget bred skærm og et dokument med meget lange linjer, kan det være vanskeligt for øjet at fokusere og holde fast i næste linje.

Det klares nemt med programmet, der dog forudsætter, at man først laver billeder af skærmbilledets kildematerialer og så åbner billederne med programmet. Når man har prøvet det et par gange, tager det ingen tid.

Når billedet er åbnet, taster man bare “d” og så får man et dashboard/betjeningspanel til venstre (vist her til højre).

Her har jeg valgt rektanglet og “malet” hele linjen med det. Når man når til enden af linjen af billedet, trækkes rektanglet ned til den nye linje. Det er utrolig smart.

At knække “den gotiske knude” er som at podcaste

Jeg elsker at transskribere. Der er altså noget over det med at begynde at se på et ord eller en sætning og tænke “Det får jeg aldrig nogensinde mening i” og så alligevel pludselig at knække “den gotiske knude” (tak til Mike Lyng for udtrykket).

Ved længere dokumenter har jeg fundet en metode, der virker godt for mig: jeg læser først hele kilden med alle mine mange fejl, mangler og spørgsmålstegn, men alligevel giver det noget mening om sagen. Jeg læser kun og skriver ikke.

Derefter begynder jeg forfra, og her skriver og læser jeg bogstav for bogstav og ord for ord, samtidig med at jeg skriver teksten i det gratis Notepad++.

En af de utallige fordele ved Notepad++ er, at programmet husker dokumentets ord. Det gør det uhyre nemt gang på gang at skrive fx “Høiesteret”, “Christian” og Westermann”.

Sammenhængen til at podcaste

Jeg har mit manuskript, som jeg har gennemlæst flere gange. Den første optagelse kører jeg bare igennem fra punkt 1 til fx 20. Så lytter jeg til den første optagelse og retter i manus, hvor lydfilen afslører fejl og mangler; det kan fx være et “ikke”, der sluges og bliver til “ikk”, et “at”, der bliver til “or” eller pauser, der mangler. Lytterne skal jo kunne forstå, hvad der foregår og også kunne følge tankegangen, idet episoderne er relativt videnstunge. Jeg skriver simpelthen ordet “pause” i manus. De slugte eller forvanskede ord markerer jeg med gult, så jeg ved, at her er en fælde, jeg ikke skal falde i.

Herefter begynder jeg forfra og optager fx fire eller fem sektioner ad gangen, så jeg ender med fx fem stumper lyd. Det har den fordel, at når der er en fejl, kan jeg bare nøjes med at lave netop den stump om i stedet for at begynde helt forfra (og måske lave nye fejl).

Næste trin er at klippe stumperne sammen – gerne i den rigtige rækkefølge – med det gratis program “Audacity”. Introen skal klippes ind som det første, og hver episode skal slutte med outtroen.

Når alt er mixet til én lang lydfil, lytter jeg igennem igen og prøver at fange og rette alle fejl. Det indebærer typisk at ændre pausernes længde. Herefter er der et trin med normalisering, så tonehøjden er nogenlunde ens hele vejen igennem.

Til sidst skal episoden eksporteres til mp3, hvorefter selv lyddelen er færdig. Så mangler jeg kun episodebeskrivelsen.

Klikker du på billedet herunder, kommer du til Danske Slægtsforskeres podcast:

Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge. Jeg svarer dig også relation til artiklen til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder kort. Jeg svarer til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid. Herefter vil du stryge lige igennem.

,

Skotsk whisky og sækkepibe i Hvidovre Vinhus

Liv på Hvidovre Torv

Skotsk whisky og sækkepibe i Hvidovre Vinhus

En aften på Hvidovre Torv blev alt andet end almindelig: seks skotske whiskyer, en fortælling om whiskyens historie og pludselig marcherede sækkepiberne ind i vinhuset.

Jeg er overbo til Hvidovre Vinhus, og det er jeg ikke ked af. Anders ejer butikken og Torben er logistikchef, lagerforvalter, opvasker og alt det resterende. Sidst – men ikke mindst – har de begge en kolossal viden om det, de sælger og om service. Begge dele er en sjældenhed nu til dags.

Udvalget er enormt, og man behøver ikke være rig for at købe en hverdagsvin hos dem.

De gør meget ud af, at butikken altid er ren og indbydende at besøge. Kodeordet er “lækker”.

Anders åbnede butikken på Hvidovre Torv for ca. fire år siden, og det har betydet, at der er kommet liv på torvet, der tidligere bare var en stor død og kedelig flade i Hvidovre Nord uden nogen form for aktivitet. Åbningen af vinhuset har trukket flere andre butikker med kvalitet med sig.

En aften med skotsk whisky og sækkepibe

De afholder smagninger 2 – 3 gange pr. måned, og jeg har tit tænkt på at melde mig til, men da jeg ikke er så god til store forsamlinger, er det blevet ved tanken. Whiskyen trak alligevel for meget i mig. Prisen har selvfølgelig været, at jeg har sovet i 12 timer, men det var det hele værd!

Det blev en fantastisk aften, hvor Erik (Torbens bror) delte ud af sin enorme viden om skotsk whisky. Jeg elsker, når et menneske har indgående viden om et emne og også kan formidle sin viden. Vi fik historien helt fra whiskyens opståen (vist i 1600-tallet) og til, hvor den er i dag, og mange andre detaljer, jeg ikke kan huske.

Vi smagte på seks forskellige whiskyer. Den første brød jeg mig ikke om, men de resterende havde en fantastisk duft og en fin smag; måske ikke ligefrem runde men alligevel tiltalende.

The Heather Pipes & Drums of Copenhagen

Sækkepiberne var aftenens store overraskelse. Jeg vidste det på forhånd, for Torben havde fortalt det, men jeg holdt mund. Pludselig marcherede “The Heather Pipes & Drums of Copenhagen” ind og gav tre numre – blandt andet Amazing Grace, og så var jeg næsten rørt til tårer.

Bandet hører til her i Hvidovre, men selvom jeg har boet her siden 2007, havde jeg aldrig hørt om det.

Det har ikke været nemt for bandet at få lov at slå sig ned i Hvidovre. I oktober 2008 sagde Folkeoplysningsudvalget “Nej tak”.

– Kan ikke godkendes på grund af manglende lokal tilknytning! Denne korte, lakoniske meddelelse blev forleden givet til “The Heather Pipes and Drums of Copenhagen” – et af landets ældste og mest kendte sækkepibeorkestre – af Hvidovre Kommunes Folkeoplysningsudvalg. Foreningen ville meget gerne flytte fra København til Hvidovre, idet man vidste, der var egnede ledige lokaler til orkesterspil, bl.a. på Engstrandskolen.

Hvordan bandet alligevel har fået hjemsted her, ved jeg ikke.

Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge. Jeg svarer dig også relation til artiklen til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder kort. Jeg svarer til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid. Herefter vil du stryge lige igennem.

,

Datafelter skal ikke indeholde transskriptioner

Big data

Datafelter skal ikke indeholde transskriptioner

Store mængder slægtsdata kræver disciplin. Hvis datafelter og transskriptioner flyder sammen, mister man både overblik og dokumentation. Her får du en forklaring på, hvorfor datafelterne skal være rene og kilderne ordrette – og hvordan du undgår, at din database vokser sig uendeligt stor på grund af stavevarianter og kreative løsninger.

Når man har slægtsforsket i mange år, har man samlet uendelige mængder af data sammen. Og det kan være svært at holde styr på dem. Denne artikel prøver at hjælpe lidt på vej.

Der er stor forskel på det, man på den ene side kan kalde “datafelter” og på den anden side det, der står i kilderne og som rummer transskriptionerne.

Datafelterne skal være “rene”, mens transskriptionerne skal være en ordret gengivelse af kilderne.

De første eksempler stammer fra mit stedregister fra nogle af “mine store steder”, hvor jeg har utallige både aner og familiemedlemmer: Disse steder staves i kilderne på mange sindrige måder: Thyregod er Tyrgoed eller Thyrgoed, Snejbjerg i Hammerum Herred er i kilderne fx Sneiberg, Askær i Brande Sogn er måske Askier, og Hindskov i Thyregod Sogn er ofte Hindskou.

I mine transskriptioner bevarer jeg selvfølgelig de ordrette angivelser. Man skal aldrig rette i kilderne. De skal stå rene, så man altid nemt kan finde tilbage til det, der egentlig stod. Det har man behov for, når/hvis man senere vil fortolke teksten.

I stedregisteret skriver jeg det samme som krabsen.dk skriver: fx Snejbjerg, Askær, Hindskov og Thyregod. Og når jeg nu ser på dette billede, kan jeg se, at Store Toustrup selvfølgelig skal rettes til Store Tovstrup. Ellers ville stedregisteret vokse til det uendelige, når de forskellige angivelser reelt dækker over det samme. Både Tyrgoed og Tyregoed er jo Thyregod i Nørvang Herred i det gamle Vejle Amt.

Og bare helt enkelt: Kirkegaard er selvfølgelig Kirkegård.

Jeg har også tidligere skrevet om dette, og i den artikel skriver jeg også om at juice kirkebogen (eller anden kilde). Med det mener jeg, at man skal forsøge at presse alle data ud af kirkebogen. Hver eneste transskription rummer utrolig meget information, der kan blive til utrolig mange data.

Andre eksempler stammer fra beskæftigelserne: I kilderne står ofte Huusmand, og det skriver jeg ordret af i transskriptionen. Men i datafeltet skriver jeg Husmand. Og fx Cancellieraad i kilden bliver til Kancelliråd i datafeltet. Og så videre.

Kilder og transskriptioner skal holdes skarpt adskilte

De to typer skal holdes skarpt adskilte, så man altid ved, hvad der er hvad. Man skal aldrig tolke i selve transskriptionen.

Hvis den direkte dokumentation mangler, må man konstruere argumenter på grundlag af indicier og sandsynlighedsvurderinger. Det skal bare ske adskilt af selve kilden. Man må altså placere det et andet sted. Jeg placerer det selv typisk i feltet, Legacy kalder for “Forskning”, og som egentlig er et meget dækkende ord:

Eller dette eksempel, hvor flere MyHeritage-sider angiver et dødsfald uden at angive hverken sted eller kilde:

Brug felterne til deres formål

Når jeg hjælper andre slægtsforskere med at få en TNG-side op at køre, ser jeg mange interessante eksempler på datafelternes anvendelse.

Et eksempel fra det seneste er, at beskæftigelsen er placeret i navnefeltet. Så kunne min biologiske tipoldefar fx blive til “Peter Waldemar Eliasen Korsanger ved Det Kongelige Teater”. Han hed Peter Waldemar ELIASEN, og han var (på et tidspunkt) korsanger ved det kongelige teater.

Men der er jo en grund til, at udviklerne af fx Legacy har opfundet de mange felter i programmet til os. Der er fx et særskilt felt til beskæftigelserne, og beskæftigelser må angives i flertal, eftersom folk ikke har den samme beskæftigelse livet igennem. Et banalt eksempel er Gårdmænd der – på grund af social deroute – blev husmænd og endnu senere indsiddere.

Min omtalte tipoldefar var livet igennem cigarfabrikant, cigarmager, sanger, korsanger, tobaksfabrikant og fabrikant. Hver gang en mand bliver far, og når han dør, ved man som regel også, hvad hans beskæftigelse var. Jeg noterer altid alle beskæftigelserne, for de er geniale til at fylde hullerne mellem folketællingerne ud. Han blev far mange gange mellem fx folketællingen 1855 (han var fra København) og folketællingen 1870. Alle disse beskæftigelser søger jeg at holde styr på.

Hvis jeg nu brugte navnefeltet imod dets formål, hvilken af beskæftigelserne skulle jeg så vælge at skrive? den “fineste”, som jeg ofte ser? Hvis en mand ved flere fødsler er fængselsfunktionær men på et tidspunkt stiger i graderne og bliver fængselsinspektør, ser jeg, at det er fængselsinspektøren, der angives – men hvad med alle de andre beskæftigelser, der jo skal med for at beskrive hans liv og sociale opstigning?

Andre sindrige anvendelser af felterne

I forbindelse med, at jeg prøvede at hjælpe en ny TNG-bruger, var jeg nødt til at spørge, hvorfor nogle af fornavnene var skrevet med versaler (store bogstaver). Det viste sig, at det var hendes måde at angive, at det var hendes ægtefælles aner og familiemedlemmer. Nu kan man jo selvfølgelig gøre fuldkommen, som man vil, og måske kan man selv huske de “regler”, man har opfundet. Men når man præsenterer sine data på nettet, er det svært for de besøgende at forstå disse regler. De vil bare blive forvirrede over, hvorfor nogle fornavne er med versaler og andre ikke.

Der er mange andre måder at angive, hvorfor de forskellige personer findes i TNG. Et eksempel er Legacys system med “Mærker”, der kan eksporteres som en del af GEDCOM-filerne.

Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på Facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge. Jeg svarer dig også relation til artiklen til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder kort. Jeg svarer til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid. Herefter vil du stryge lige igennem.