Du bist nicht angemeldet.

Werbeanzeige

Goldwing Studios

Treue Seele

  • »Goldwing Studios« ist der Autor dieses Themas

Beiträge: 359

Wohnort: Heidelberg

Beruf: Softwareentwickler, Vertriebler

  • Private Nachricht senden

1

22.10.2018, 09:14

Interpunktion in Neuronalen Netzen

Hallo zusammen,

wie kann ich in einem gegebenen Text ("Der Hund läuft zum Haus Hannes schaut aus dem Haus") an den am besten geeigneten Stellen einen Punkt bzw ein Komma setzen?

Es geht mir hier nicht um das eigentlich setzen des Punktes sondern um die Ermittlung der Position an welche der Punkt bzw. das Komma gehört.


Meine präzise Problemstellung ist:

Ich habe ein sehr simpes Neuronales-Netz, welches mir aus vorherigen Texten einen neuen Text aufgrund von Folgewahrscheinlichkeiten von einzelnen Wörtern bastelt. Nur eben ohne Punktuation oder Kommasetzung. Geschweige denn von Fragestellungen oder anderen Satzzeichen.


Heißt ich habe die folgenden beiden Schritte:

Texte einlesen und verknüpfungen erstellen
Neuen Text aus Datenbasis erstellen und zusammensetzen


Hat da jemand einen Ansatz, nach welchem ich mit meinem Programm nach einem Muster suchen kann und dann darauf basieren das setzen der Zeichen vornehmen kann?

BlueCobold

Community-Fossil

Beiträge: 10 859

Beruf: Teamleiter Mobile Applikationen & Senior Software Engineer

  • Private Nachricht senden

2

22.10.2018, 09:31

Ohne semantische Interpretation, halte ich das für unmöglich. Vielleicht ließe sich etwas aus deiner Methode ableiten, nach der du die Sätze bildest, aber vermutlich stünde das Komma dann ziemlich oft verkehrt, was die Sache wohl eher schlimmer als besser machen dürfte.
Teamleiter von Rickety Racquet (ehemals das "Foren-Projekt") und von Marble Theory

Willkommen auf SPPRO, auch dir wird man zu Unity oder zur Unreal-Engine raten, ganz bestimmt.[/Sarkasmus]

Goldwing Studios

Treue Seele

  • »Goldwing Studios« ist der Autor dieses Themas

Beiträge: 359

Wohnort: Heidelberg

Beruf: Softwareentwickler, Vertriebler

  • Private Nachricht senden

3

22.10.2018, 09:36

Würde es dann nicht helfen, wenn man de Programm regeln gibt nach welchen wir Menschen auch das Komma setzen?

Den Punkt finde ich rein logisch schwieriger abzuhandeln, da man theoretisch einen Satz immer weiter spinnen kann ohne irgendwann mal einen Punkt setzen zu müssen.

Schorsch

Supermoderator

Beiträge: 5 199

Wohnort: Wickede

Beruf: Student

  • Private Nachricht senden

4

22.10.2018, 09:50

Ergeben die Texte die dein Netz erstellt Sinn? Da du auf Folgewahrscheinlichkeiten aufbaust kann da ja ziemlicher Blödsinn bei rum kommen. Das selbe gilt jetzt eigentlich auch für deine Satzzeichen. Die könnten an sich auch von deinem Netzwerk gesetzt werden, es ergeben sich dabei aber die selben Probleme wie bei der Textgenerierung. An sich könntest Satzzeichen wie einzelne Worte betrachten und dann die Wahrscheinlichkeiten bestimmen dass bestimmte Satzzeichen auf bestimmte Worte folgen.
„Es ist doch so. Zwei und zwei macht irgendwas, und vier und vier macht irgendwas. Leider nicht dasselbe, dann wär's leicht.
Das ist aber auch schon höhere Mathematik.“

Goldwing Studios

Treue Seele

  • »Goldwing Studios« ist der Autor dieses Themas

Beiträge: 359

Wohnort: Heidelberg

Beruf: Softwareentwickler, Vertriebler

  • Private Nachricht senden

5

22.10.2018, 09:53

Ja, da kann ziemlicher Blödsinn bei rum kommen.

Man muss das Netzwerk mit den Texten komplementären Personen füttern. Heißt, das die Texte sich von der Schreibweise ähneln müssen.

Sonst ergibt das seltenst Sinn.

Ich nehme ja zum Beispiel eine ganz andere Schreibweise und nehme auch teilweise andere Wörter um Sätze zu bilden.

Aber der Ansatz mit dem Punkt als eigenes "Wort" und dann eine eigene Wahrscheinlichkeit zu berechnen, das scheint schon mal ein guter Ansatz zu sein.

BlueCobold

Community-Fossil

Beiträge: 10 859

Beruf: Teamleiter Mobile Applikationen & Senior Software Engineer

  • Private Nachricht senden

6

22.10.2018, 11:13

Würde es dann nicht helfen, wenn man de Programm regeln gibt nach welchen wir Menschen auch das Komma setzen?
Klar, aber dafür muss dein Netz eben die Semantik verstehen, um zu erkennen, was Nebensätze oder Aufzählungen sind, etc.
Teamleiter von Rickety Racquet (ehemals das "Foren-Projekt") und von Marble Theory

Willkommen auf SPPRO, auch dir wird man zu Unity oder zur Unreal-Engine raten, ganz bestimmt.[/Sarkasmus]

7

22.10.2018, 11:26

Es gibt einige freie Projekte zur Prüfung von Grammatik-Fehlern. Vielleicht kannst Du so ein System nutzen, um aus den erkannten Fehlern die Interpunktion abzuleiten. Üblicherweise arbeiten die mit Regelsystemen. Für Java kenne ich http://languagetool.org Dort gibt es an einigen Stellen (z.B. Relativsätze) sinnvolle Vorschläge.

Werbeanzeige