Indlæg

, ,

Tanker om datakvalitet i slægtsforskning (er toldfrie)

Tanker om datakvalitet i slægtsforskning (er toldfrie)

Af en strukturfascists bekendelser

Tanker om datakvalitet i slægtsforskning (er toldfrie)

Nu findes der (heldigvis) intet “slægtsforskningspoliti”, men hvis der gjorde, ville jeg elske at være politimester og/eller anklager 🙂

Dagens artikel drejer sig om, hvordan jeg kan lide at organisere mine data, så jeg får en god struktur både i mit slægtsforskningsprogram – Legacy – og i visningen på min hjemmeside, hvor jeg bruger The Next Generation of Genealogy Sitebuilding (TNG). Men navnene på programmerne er i virkeligheden fuldkommen ligegyldige. Det drejer sig om strukturen, der er bestemmende for kvaliteten af mine data. Med årene vokser vores data til næsten uanede mængder, og derfor er det vigtigt at holde en god orden i snart sagt hvad som helst.

Hvis du finder inspiration her, vil det glæde mig!

Jeg sondrer mellem på den ene side indholdet af felterne, hvor de forskellige informationer skal placeres og på den anden side det, man kunne kalde “friteksten”, dvs. der hvor transskriptionerne anbringes.

Datafelterne skal ikke være kildetro – men det skal friteksterne naturligvis. Herunder kommer en række eksempler, hvor jeg prøver at forklare baggrunden for, at jeg gør, som jeg gør.

Det hastigt voksende stedregister er det vigtigste

Stedregisteret har det med at vokse i turbofart, og det er svært at undgå, og det bliver endnu værre, hvis man er kildetro i de felter, hvor stederne skal skrives ind.

Et eksempel er Christian Olsen (af og til Olufsen), der ved vielsen i januar 1759 tjener på “Vindekilde Kro, Vallekilde Sogn, Ods Herred, Holbæk Amt, Denmark”. I datafeltet skriver jeg netop dette som stedet.

I kilden står: “For Christian Olufsen af Kongens Gods tienende paa Windekilde Kroe …”. I datafeltet er jeg ikke kildetro; jeg skriver ikke: “Windekilde Kroe, Vallekilde Sogn, Ods Herred, Holbæk Amt, Denmark”. Det ville give helt uoverskueligt mange steder for hvad så, hvis samme kro optrådte i nyere tid og var stavet “Vindekilde kro” osv.?

Ikke alene ville samme sted blive repræsenteret et utal af gange, men diverse programmer kan nu til dags selv finde ud af at geokode, hvilket vil sige at knytte længde- og breddegrader til det enkelte sted, men programmerne kender formentlig ikke de gamle stavemåder. Når jeg skriver formentlig, skyldes det, at jeg ikke selv har erfaring med at være kildetro i datafelterne om steder.

TNG kan selv geokode mange af stederne, hvis hvert sted rummer sogn, herred og amt. Og det er en kæmpe fordel, eftersom det er en meget tidskrævende og kedelig opgave at gøre det manuelt (hvilket jeg gjorde). En hjemmeside ses forhåbentlig af mange, og mange tilgår måske siden fra udlandet, hvorfor jeg også knytter land til stedet, og jeg staver landet på engelsk.

Når stederne er geokodet, kan fx TNG vise de nydeligste kort som eksempelvis dette, der stammer fra den samme Christian Olsen/Olufsen:

Tanker om datakvalitet i slægtsforskning (er toldfrie)

Beskæftigelserne

Knap så vigtige er beskæftigelserne. Her drejer det sig om læsbarheden og brugernes mulighed for at forstå, hvad der faktisk menes. Det centrale i dette afsnit er, at jeg naturligvis ikke ændrer på kilden. Den bevares, som den er.

Ofte får vi informationerne om beskæftigelserne fra folketællingerne, og de kan være noget formørket sludder både indholdsmæssigt og det, der står skrevet.

Om samme Christian Olsen/Olufsen står der i folketællingen den 1. juli 1787 “Christian Olsen, 54, Gift, Hosbonde, Huusmand og Dagleier meget fattig”. Det er ikke det grelleste eksempel, for man kan jo sagtens forstå, hvad der står, men jeg har jo kilden (folketællingen), som jeg naturligvis ikke ændrer på. Da jeg synes, det er lidt interessant, at han er meget fattig, laver jeg en begivenhed (en beskæftigelse), hvor jeg ændrer det til nogenlunde korrekt nudansk: “Husmand og meget fattig daglejer”.

Et andet eksempel er min 4 * tipoldefar Hans Pedersen og hans kone Anne Larsdatter. De går og bætler med æ i 1787. Jeg laver en begivenhed (beskæftigelse) og skriver på nogenlunde korrekt nudansk om ham: “Husmand og daglejer men går mest om og betler med sin kone” (jeg håber ikke, han solgte min 4* tipoldemor).

Data i folketællingen ser sådan ud (der er flere personer end vist her):

1) Hans Pedersen, 54, Gift, Hosbonde, Huusmand og Dagleier, men gaaer mest om og bætler med sin Kone
2) Anne Larsdatter, 50, Gift, hans Kone, bætler

Tanker om datakvalitet i slægtsforskning (er toldfrie)Andre eksempler er fx læge Kongsted, der vaccinerede Ellen Sophie i Ods Herred. Kilderne kalder ham ofte “Districts-læge” el.lign., men jeg skriver “Distriktslæge” i datafeltet om vaccinationen, eller det kunne være en person, der “tiener”, hvor jeg skriver “tjener”.

Her er den fulde kilde om Ellen Sophies vaccination i 1839, som den fremgår på hjemmesiden:

“AO Salldata – KB, 11 mar. 2025, Holbæk Amt, Ods, Nørre Asmindrup, 1850-1876, KM, Konfirmerede piger – opslag: 2 af 19 opslag (Troværdighed: 4).

1854 nr. 2. Ellen Sophie Larsdatter. Skaverup. Gmd. Lars Jensen og Hstr. Kirsten Madsdatter, Skaverup. født den 18de Junij 1839. Gode Kundskaber og sædelig Opførsel. Vaccineret: d. 13de Septbr 1839 af Districtslæge Kongsted.”

Jeg afholder mig fra at fortolke

Helt generelt tolker jeg ikke i datafelterne. Hvis der er behov for fortolkninger, fx fordi det, der fremgår af kilden, påviseligt er noget sludder, så kommenterer jeg det i en note.

Bortset fra det ovenfor beskrevne om steder og beskæftigelser, mener jeg, at man skal passe meget på med at fortolke i datafelterne. Det skyldes, at det ellers kan blive noget værre rod, hvor man måske flere år efter sidder og kommer i tvivl om, hvad der er hvad. Hvad stammer fra kilden, og hvad beror på en fortolkning?

Billedfilernes navne – slut med “Søg og du skal finde”

Tanker om datakvalitet i slægtsforskning (er toldfrie)For et par år siden tog jeg mig sammen og omdøbte alle billedfilerne, så de alle har den samme struktur.

Jeg indrømmer blankt, at det var temmelig kedeligt, men nu er jeg glad for det.

Før jeg begyndte, kunne et billede eksempelvis hedde “Far i barnevogn 1922”. Efter omdøbningen hedder det “Stegemüller, Jørgen-1” el-lign.

En af de fordele, jeg har fået ud af det, er, at det er blevet så utrolig nemt at finde billederne igen. Før i tiden skulle jeg søge og måske finde det billede, jeg ledte efter. For det var jo ikke sikkert, jeg kunne huske, hvad jeg havde kaldt billedet.

Prøv at se billedet til højre og tænk over, hvor mange fx “Christensen” du selv har.

Hovedreglerne for navngivningen er:
  1. En person: Efternavn komma fornavn
  2. Flere personer (med mindre det er et stort gruppebillede): Alle personer fra venstre mod højre navngives med efternavn komma fornavn komma (dette komma adskiller inden den næste person) efternavn komma fornavn osv.

De programmer, jeg bruger, kan nemt vise billederne på hjemmesiden, selvom der er mellemrum i billedfilernes navne. Jeg er klar over, at Mette Fløjborg tilråder underscores (_), da det er hendes erfaring, at visse browsere ellers ikke kan vise billederne.

Hvis jeg brugte Mettes regel, skulle mine billeder eksempelvis hedde “Stegemüller_Jørgen-1” el-lign. 

Tilføjelse den 9. april 2025

Jeg er nu blevet klar over, hvad der skal til, for at man kan bruge mellemrum, kommaer, fx “ü” osv. i filnavne: Alt skal sættes til UTF-8, som Roger fra TNG-forum forklarer herunder:

“If things are set up correctly using accented characters, spaces etc in file names is no problem at all.

Things include

Server set to use UTF-8
FTP software set to use UTF-8 to upload files with accented characters in the file name
Website (in our case usually TNG) set to use UTF-8
Database set to use UTF-8

Then it all works as expected. If any of these “things” are not using UTF-8, then problems can arise.

Roger”

Har du kommentarer til artiklen?

Så er jeg glad for at modtage dem i relation til artiklen, dvs. i artiklens kommentarfelt herunder, ikke på facebook og ikke via Messenger. Det skyldes, at kommentarer og artiklen jo ellers dekobles, og så er din kommentar ikke noget værd i fremtiden. Det er ærgerligt for os begge. Jeg svarer dig også relation til artiklen til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid.

Hvis du ikke tidligere har kommenteret en af mine artikler her på siden, skal din kommentar først godkendes (spamhensyn). Min responstid er under normale omstændigheder kort. Jeg svarer til morgenkaffen, kl. 13:00, kl. 18:00 og ved sengetid. Herefter vil du stryge lige igennem.

,

Frivilligt arbejde og 740 stedkoder

Frivilligt arbejde og 740 stedkoder

Jeg er en anelse træt i hovedet

Frivilligt arbejde

Jeg har gjort en TNG-bruger glad i dag, og det er tilfredsstillende. Han var kørt sur i opdateringer, visning af data i felter eller ej, koblingen mellem Legacy (off-line programmet til slægtsdata) og TNG samt nogle andre ting, der let kan drille, hvis man ikke har en firkantet hjerne. Og vel at mærke ikke har rodet med begge programmer næsten i døgndrift gennem flere år.

Det er længe siden, jeg skrev dette på min TNG-side:

Efterhånden har jeg mange års erfaring med at opsætte TNG, som denne side er lavet i. Jeg tilbyder at lave en side for dig, hvis du ikke selv tør give dig i kast med det, men alligevel gerne vil præsentere dine data på nettet. Det koster ikke noget. Den eneste forudsætning er, at du på forhånd har orden i data og billeder, for ellers er arbejdet for stort, og jeg gider ikke gøre orden i dine ting for nu at sige det lige ud.

Samlet set har jeg haft tre henvendelser, så det er ikke fordi, tilbuddet bliver misbrugt. De mennesker, jeg har bistået, er blevet så glade, at det er det hele værd, også selvom de ikke har den forudsatte orden i data og billeder.

Jeg har fundet en model til at komme om ved det problem: Jeg laver så meget, der er muligt med de data, der nu en gang er, og så laver jeg en mail med “noter og dokumentation“, hvor jeg forklarer problemerne og hvordan de formentlig kan løses. Så kan brugeren selv arbejde videre. Opstår der efter en grundig oprydning nye problemer, er jeg selvfølgelig til rådighed. Det fungerer faktisk ret godt.

Når jeg siger, jeg er blevet pensionist, foreslår Gud og hver mand, at jeg skal lave frivilligt arbejde. Af en eller anden grund er det første, de kommer i tanke om, at jeg skal stå i en genbrugsbutik… På et tidspunkt overvejede jeg at blive en form for IT-hjælper hos Ældresagen, der har en afdeling 800 meter væk. Min egen model er vist bedst, for jeg har nok ikke tilstrækkelig tålmodighed til det andet. Det passer mig glimrende at kunne sidde ved egen PC og i fred og ro få ting til at fungere og så bagefter analysere, hvorfor det alligevel ikke fungerer.

Der var langt gennem “Sankt-et-eller-andet”

På et eller andet tidspunkt inden så længe, er jeg ved vejs ende med mit “stedkodeprojekt” – jeg er 67,8 pct. færdig med GPS-koordinaterne. I dag har jeg sat koordinater på 740 steder… Der var langt gennem alle dem med Sankt-et-eller-andet, som der faktisk var hele 58 af.

Jeg startede med “, , , Canada” den 11. juli og sluttede dagens arbejde med “Sankt Thomas Kirke, Sankt Thomas Sogn, Sokkelund Herred, Københavns Amt, Denmark”.

Det er faktisk ufatteligt kedeligt, men jeg ser frem til resultatet. Hvis der er fejl af større beskaffenhed, gider jeg aldrig se på GPS-koordinater igen, for så interessant er det heller ikke; det kræver flere museklik end hjernevindinger. På et tidspunkt begyndte min mus tilmed at leve sit helt eget liv, den ville fx kun markere i totredjedele af tilfældene, og så er det en svær opgave at lave cut’n paste. Heldigvis har jeg flere mus – også de avancerede og dyre MX ERGO trackball-mus. De burde bare ikke opgive ævred så hurtigt. Jeg regner med at klage til forhandleren i morgen, for det er ikke første gang, den ene af dem sætter ud.

En side, jeg har meget glæde af, er Wikipedia, for næsten alle sogne er lagt ind inkl. deres GPS-koordinater. Og der er oplysninger om sognets tilhørsforhold til herred og amt også før kommunalreformen af 1. januar 1970. En guldgrube.

Jeg kan ikke lade være med at tænke på, at også der har siddet et eller flere mennesker og lavet frivilligt arbejde. Hvor er det dejligt, nogen gider. Tænk på det næste gang, du finder noget herligt på nettet: det er højst sandsynligt opstået ved frivillig og ulønnet arbejdskraft.

 

 

, ,

Kommunikation med en firkantet hjerne

Kommunikation med en firkantet hjerne

Jeg bruger ikke Messenger

Kommunikation med en firkantet hjerne

Mange sender beskeder via Messenger – men den platform bruger jeg ikke. Det skyldes, at jeg ikke kan overskue forløbet i en “samtale” på Messenger. Der er kun en smal kolonne helt ude til højre til beskederne, og jeg må “rulle” meget op og ned, fordi jeg har brug for at se, hvad det hele egentlig startede med. Jeg kan ikke sammenholde indholdet fra top til bund.

Til gengæld hjælper jeg altid gerne, hvis der skulle være et eller andet, jeg har viden om. Jeg besvarer altid mails. Vil du i kontakt med mig, har du (mindst) disse muligheder:

  1. Du har min e-mail-adresse fra tidligere korrespondancer,
  2. Du kan kontakte mig via hjemmesidens kontaktformular, og
  3. Jeg er nem at finde på nettet med Googles hjælp.

Jeg bruger ikke emojis og gifs

Vær rar ikke at sende emojis eller gifs og slet ikke gifs, der bevæger sig. Jeg har efter bedste evne forsøgt at få min browser (Firefox) til at filtrere alt det skrammel fra.

  1. For så vidt angår emojis: Jeg har tidligere undersøgt sagen og fundet ud af, at der findes ca. 3.000 emojis – de 2.999 kender jeg ikke. Og jeg gider ærlig talt ikke sidde med en “ordbog” for at finde ud af, hvad diverse figurer betyder. Vil du mig noget, så send nogle ord. Dem forstår jeg som hovedregel til fulde.
  2. For så vidt angår især de bevægelige gifs: De er jo meget søde/sjove, men jeg kan ikke læse din tekst samtidig med, at der er et eller andet, der hopper og danser på skærmen. Det betyder, at jeg skal starte med at finde ud af, hvordan jeg får uhyret til at stå stille. Og det gider jeg ærlig talt heller ikke bruge min tid på.

Jeg foretrækker strukturerede beskeder

Vil du noget helt konkret, fx have hjælp til din side med TNG, så strukturer din besked. Lav en liste, der tydeligt angiver de problemer, du ønsker hjælp til. Gør du det ikke, betyder det nemlig, at det er mig, der kommer til at gøre det, hvilket kan medføre gætterier fra min side. Den tid kunne jeg i stedet have brugt på at hjælpe dig. Vil du ikke foretrække det?


Her kommer du til menupunktet “Psykiatri”, hvor du kan navigere mellem alt, jeg i årenes løb har skrevet om bipolar affektiv sindslidelse og Aspergers syndrom.