Suche: Datenbank mit männlichen und weiblichen Vornamen

fabiopigi

fabiopigi

Aktives Mitglied
Thread Starter
Dabei seit
03.06.2005
Beiträge
2.714
Reaktionspunkte
253
Hi

Ich habe eine Datenbank mit ~1500 Vor- und Nachnamen. Leider fehlt das Geschlecht dabei und alle manuell zu bestimmen dauert zu lang.

Was ich als Idee hätte, wäre eine Datenbank mit vielen männlichen und weiblichen Vornamen zu haben und die Vornamen meiner Datenbank mit jener abzugleichen. Der Grossteil wäre so zu bestimmen, die "unbestimmbaren" kann man manuell abhandeln.

Leider habe ich solch eine Datenbank nirgends gefunden, weiss jemand wo es solch einen Dump, am besten in SQL oder CSV gibt?
 
Rein mal interessehalber, was machst du mit geschlechtsneutralen Namen?
 
Rein mal interessehalber, was machst du mit geschlechtsneutralen Namen?

Solche Namen wie Andrea (italienisch auch als Männername) sind halt einfach gegeben und öfters die Ausnahme.
Wenn man später was findet wird es korrigiert.

Sobald man eine Aufgabe automatisiert die nicht auf Logik basiert entstehen Fehler, lässt sich nicht ändern, ausser man verzichtet vollkommen auf die Automatisierung.
 
Jep, ist verständlich. Mich hat nur interessiert wie du das Problem löst. :) Danke für die Aufklärung.
 
Hab inzwischen was gefunden was eigentlich genau das gesuchte ist, aber kostet doch noch einiges.
http://www.datendieter.de/item/Deutsche_Vornamen_(maennlich)
50€ für ein Hobbyprojekt welches nichtmal veröffentlicht werden darf ist mir zuviel.
Sonst noch Listen mit vielen Namen drauf? Auch als Text zum Copy/Paste ;)
 
geh zu babynamen.de und co und les die mit einen skript aus, ist doch kein aufwand.
 
Bevor ich mich da so verkopfen würde ... in 2 Stunden hast du die Sache manuell
erledigt, das ist schneller als stundenlang nach einer technischen Lösung zu suchen,
die dann doch irgendwo nicht ganz funktioniert.

Wenn du schnell bist, geht es locker auch in 1 Stunde.
 
Bevor ich mich da so verkopfen würde ... in 2 Stunden hast du die Sache manuell
erledigt, das ist schneller als stundenlang nach einer technischen Lösung zu suchen,
die dann doch irgendwo nicht ganz funktioniert.

Wenn du schnell bist, geht es locker auch in 1 Stunde.

Problem ist, wir sind eine technische Hochschule und die paar Frauen die es hat sind leider nicht alle als solche zu erkennen. ^^
Ist böse ausgedrückt, aber bei ein paar Bildern erkennt man wirklich schwer was es ist.
 
Problem ist, wir sind eine technische Hochschule und die paar Frauen die es hat sind leider nicht alle als solche zu erkennen. ^^
Ist böse ausgedrückt, aber bei ein paar Bildern erkennt man wirklich schwer was es ist.

Aber eine Datenbank erkennt die Bilder doch auch nicht. :noplan:

Du müsstest also doch nur die Datenbank in eine Tabelle einlesen, diese mit
"m" und "w" ergänzen und entsprechend abhaken. Jede Sekunde ein Name, das
dauert 25 Minuten.
 
Hab ich gemacht, die Datenbank ist fertig. Bei 4 Personen konnte die Datenbank nicht automatisch bestimmen.
Ich habe folgendes gemacht:
Eine Datenbank "vornamen" mit den Feldern vorname,geschlecht.
Eine Datenbank "students" mit den Feldern vorname,nachname,pid(personID),geschlecht

Geschlecht ist 0=undefiniert,1=männlich,2=weiblich.

Das Script geht alle Datensätze der "students" durch welche geschlecht=0 haben und schaut, ob in der Tabelle "vorname" der Vorname enthalten ist.
Ist dieser vorhanden, wird ein 1 oder 2 eingetragen.

Das ganze ist bereits fertig, natürlich wird es vielleicht den einen oder anderen Fehler drin haben, aber das sieht man dann wenn man am suchen ist. :)
 
Du kannst die Namen auch über Wolfram ALpha abfragen. Ich weiß zwar nicht wie vollständig die DAtenbank dort ist, insbesondere bei deutschen Namen, aber bei "Katharina" und "Michael" konnte er mir sagen, obs männliche oder weibliche Vornamen sind ;)
 
ja würde schon gehen, aber eben lokal ist schneller als via internet. :)
Dann bräuchte ich hunderte von Wolfram anfragen starten und diese interpretieren.
Würde fast schon an DDoS grenzen und das wäre nicht gerade optima :D
 
najaaaa... also bei 1500 Abfragen eher nicht ;-)

aber kannst auch Michael; Katharina; Jaqueline; Justin; Chantal; in einer Abfrage zusammenfassen ;-) Aber du hast es ja eh schon gelöst.
 

Nix da :p
Hat ne Überlegung dahinter. Wir haben einen Frauenanteil von 12.5%. Wenn wir nun das ganze in einen String packen wollen und möglichst platzsparend speichern, können wir es so machen:
1,1,1,2,1,1, oder in Bitfolge komprimiert:
101010110101

Hätten wir es umgekehrt gemacht wäre der Bitfolgestring so:
11011011010110110

Ob man es so nutzen wird ist eine andere Frage, aber ein Gedanke steht dahinter.

Zudem 2>1, also Frauen>Männer
:D
 
Nix da :p
Hat ne Überlegung dahinter. Wir haben einen Frauenanteil von 12.5%. Wenn wir nun das ganze in einen String packen wollen und möglichst platzsparend speichern, können wir es so machen:
1,1,1,2,1,1, oder in Bitfolge komprimiert:
101010110101

Hätten wir es umgekehrt gemacht wäre der Bitfolgestring so:
11011011010110110

Ob man es so nutzen wird ist eine andere Frage, aber ein Gedanke steht dahinter.

Du studierst sicher irgendwas mit Geisteswissenschaften, oder? :crack:

Oder kommt das Thema Entropie erst im 2. Semester?
 
Hehe, ich musste doch irgend eine Erklärung finden, warum Frauen nun 2 haben und Männer nur 1. :p
Aber ja, Entropie kenn ich nur von der Chemie/Physik her ;)
 
Zurück
Oben Unten