Deutsches CustomWakeWord trainieren?

Hallo zusammen,

hat jemand von Euch es geschafft, ein deutsches CustomWakeWord für Voice Assist zu trainieren? Und wenn ja, wie?

Mit der offiziellen Anleitung habe ich es geschafft, den Trigger Yo Digger zu erstellen. Aber auch nur, weil das halt englisch ausgesprochen wird (trainiert als Yo Diggah).

Trainiert man (blödes, aber funktionierendes Beispiel) Hallo Peter, müsste man es dann analog Hello Pider aussprechen, damit getrigger wird.

Vermutlich kann man das colab playbook, was in der offiziellen Anleitung verlinkt ist, irgendwie umschreiben, sodass ein deutsches Sprachmodel verwendet wird – aber bevor ich das angehe, wollte ich hier mal nachfragen, ob es vielleicht andere Methoden gibt, bzw. ob jemand das bereits umgeschrieben hat und zur Verfügung stellen würde.

LG

Direkt in ersten Punkt steht dort Currently, only wake words in English are supported.

Wenn die offizielle Anweisung darauf hinweist, dass es nur mit englischen Wake Words funktioniert, gehe ich davon aus, dass dies Gründe hat. :wink:

Ich habe das so verstanden, dass ausschließlich englischsprachige wake words mit diesem training environment erstellt werden können.

Der *.tflite Datei, die das wake word enthält, ist vermutlich egal, welche Sprache tatsächlich trainiert wurde. Kann mich natürlich auch täuschen, aber solange diese Datei auf das entsprechende “Geräusch” (also Wort, aber vermutlich könnte man auch ein Händeklatschen oder Hundebellen trainieren) trainiert wurde, sollte doch jegliche Sprache funktionieren…?

Interessante Frage … Laut Doku soll Porcupine wake words anderer Sprachen unterstützen - sogar das allseits beliebte Stachelschwein :joy:

1 „Gefällt mir“

Stachelschwein hätte natürlich auch was :laughing:

Ich habe porcupine1 aus dem Add-On Store mal installiert. Die Wyoming-Integration findet es direkt, das war’s dann aber schon. Keine Einstellungsmöglichkeiten für custom wake word – die Docs habe ich nur überflogen, aber konnte nichts darüber finden, wie ich ein wake word selbst trainieren und dann einbauen kann.

Dann habe ich mir doch mal das Colab Playbook angesehen, und siehe da:

Das meinte ich auch in meiner Antwort an @tarag ; ja, “offiziell” wird nur Englisch unterstützt, was ich so deute, dass Englisch halt im Colab Playbook hardcoded ist. Wenn man das Playbook clonen und abändern würde, müsste man auch ein deutschsprachiges Wort mit dem deutschen Model trainieren können.

Leider konnte ich das nicht weiter ausprobieren. Mit dem deutschen Sprachmodel spuckt das Programm bei dem Vorschauwort nur Kauderwelsch aus. Also habe ich in einem anderen Browser das Playbook noch mal neu geladen, bekomme nun dort aber auch auf Englisch (also ohne jegliche Änderungen am Originalcode) dasselbe unverständliche Zeug.

Obwohl ich mit dem Original ja schon erfolgreich ein custom wake word trainiert hatte. Vielleicht gibt es gerade ein Serverproblem, oder ich habe es zu oft in zu kurzer Zeit hintereinander ausprobiert (anderer Browser, aber trotzdem ja dieselbe IP).

Also da mein (nicht besonders tolles) custom wake word ja funktioniert, würde ich schon bei wyoming bleiben. Wahrscheinlich kann man auch Sachen wie “Moin Horst” phonetisch so umschreiben, dass man sie auf Deutsch bekommt (“Moines” wie in der Stadt “Des Moines”, “horsed” oder “horest” oder “whore_ss_t” wie in “Pferd” und… naja… :joy: )

Finde ich aber nicht so gut. Ich muss mal in ner ruhigen Minute schauen, ob das Colab Playbook doch mit dem dt. Sprachmodel klarkommt (und das jetzt einfach aus irgend nem random Grund nicht geklappt hat), oder ggf., ob ich es lokal trainieren kann. RTX4070, das würde vermutlich ein paar Stunden dauern, statt ~30 Minuten über Colab, aber wenn es dafür dann klappt, wäre das einmalig ja den Aufwand wert.

AUßER natürlich, hier kommt doch noch eine bereits getestete Lösung und ich kann mir das alles sparen :wink: Anybody?