PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Spracherkennung unter Linux



tobiast
28.04.06, 20:12
Seh ich das richtig, dass es unter Linux keine Lösung für Spracherkennung gibt.
Also ein Programm mit dem man in Openoffice.org oder anderen seinen Text hinein diktiert ?

oli993
29.04.06, 07:58
Hallo,

ich habe mit Spracherkennung keine Erfahrung, du könntest dir aber mal Sphinx und HTK anschauen:

http://cmusphinx.sourceforge.net/html/cmusphinx.php
http://htk.eng.cam.ac.uk/

Keine Ahnung, ob sich das in OpenOffice integrieren läßt.
Gruß Oli.

DERRICHTER
29.04.06, 12:40
Bisher gibt es jedenfalls keine, die IBM ViaVoice oder Dragon Naturally Speaking entsprechen. Die Diktierprogramme sind der einzige Grund, weshalb ich überhaupt noch Windows installiert habe, sonst wäre das Betriebssystem bei mir längst rausgeflogen (Auch wenn ich zugeben muss, dass es bei der Textverarbeitung beim Öffnen von unter Suse geschriebenen Texten unter Windows immer noch die dollsten Überraschungen geben kann. Es gab bei früheren Versionen von ViaVoice die Möglichkeit, diese mit viel Frickelarbeit unter Linux einzusetzen. Ob das heute noch geht, dazu habe ich keine eigenen Erfahrungen und auch im Internet nichts gefunden. Die fehlenden Diktierprogramme werden wohl auf absehbare Zeit die große Schwachstelle für Linux sein und die Verbreitung als Office-Desktop erschweren.

stefan-tiger
29.04.06, 12:41
Nicht nur Speech-to-Text-Prorgamme sind unter Linux Mangelware, auch Test-to-Speech-Prorgamme :(

stefan.becker
29.04.06, 12:56
Die fehlenden Diktierprogramme werden wohl auf absehbare Zeit die große Schwachstelle für Linux sein und die Verbreitung als Office-Desktop erschweren.

Wage ich zu bezweifeln. Da gibt es andere, wichtigere Software.

Für meine Texte zu Hause nehme ich lieber die Tastatur.

DERRICHTER
29.04.06, 13:20
Tja, nun ist es aber so, dass es eine Menge Bereiche gibt, in denen diktiert wird (Anwaltskanzleien, Gerichte, im wissenschaftlichen Bereich, Ärzte usw.). Und in all diesen Bereichen interessiert man sich mehr und mehr für Diktierprogramme (weshalb unter anderem auch ich eins verwende), weil aus Kosten-, aber auch aus Zeitgründen das Kanzleipersonal eingespart werden soll. Und dies wird in den nächsten Jahren dramatisch zunehmen. Ich hatte bisher IBM ViaVoice in der Linguatec-Version (10.0), die schon ganz gut war und jedenfalls deutlich besser als Dragon Naturally Speaking in der Version 7.0. Zwischenzeitlich habe ich mir Dragon Naturally Speaking in der Version 8.1 besorgt und muss sagen: Dramatisch besser. Jetzt kann man in der Tat ganz flüssig mit einer ganz geringen Fehlerquote diktieren. Bisher war das Problem für Linux schon deshalb nicht drängend, weil eben Diktiersoftware auch unter Windows immer noch eine Geduldsprobe war. Ich kann nur sagen, mit der jetztigen Software diktiere ich alles. Und wenn die das weiter verbessern, wird der Berufszweig der Schreibkraft vollständig wegbrechen. Es wird für den Office-Desktop künftig ein Problem sein, wenn für ihn keine Diktiersoftware zu bekommen sein wird. Und was Deine Feststellung zur wichtigeren Software angeht: Für 'nen Officedesktop gibt es einige wenige Programme, die benötigt werden. Vorrangig eine ordentliche Textverarbeitung und eine schnelle Datenbank. Wer Mal in den großen Büros der Wirtschaft zugange war, weiß, dass es auf mehr nicht ankommt. Und für die Textverarbeitung, aber auch für die Eingabe von Datensätzen in eine Datenbank wird künftig Diktiersoftware unverzichtbar sein.

Übrigens hatte es im Laufe der letzten anderthalb Jahre hier wiederholt Anfragen gegeben in dem Sinne, dass man den Chef zur Installation von Linux statt Windows überreden wolle, der das aber abhängig von der Möglichkeit des Einsatzes einer Diktiersoftware gemacht habe.

Ein Beispiel sei: http://www.linuxforen.de/forums/showthread.php?t=162314&highlight=Diktiersoftware.

stefan.becker
29.04.06, 19:48
http://gnomefiles.org/app.php?soft_id=1369

Zufällig gerade gefunden.

oli993
30.04.06, 07:30
Nicht nur Speech-to-Text-Prorgamme sind unter Linux Mangelware, auch Test-to-Speech-Prorgamme :(

Ich weiß leider nicht mehr, wie das entsprechende Programm heißt (txt2pho?), aber schon vor Jahren habe ich mir auf der Konsole Textdateien vorlesen lassen können.

Einen entsprechenden Artikel hatte ich glaube ich mal in der "Linux User" gefunden. Habe es aber als eine (für meine Zwecke nicht nötige) Spielerei gesehen und mich nicht weiter damit beschäftigt.

Gruß Oli.

Maar
30.04.06, 08:39
text-to-speech:
http://tcts.fpms.ac.be/synthesis/mbrola.html

Und die Proben hören sich sogar richtig gut an.

DERRICHTER
30.04.06, 13:20
Das Vorlesen von Texten ist unter Linux überhaupt kein Problem. Mbrola ist bei mir installiert und liest mir eifrig alles vor, was ich vorgelesen haben will (Texte aus der Textverarbeitung, Internetseiten, aber auch automatisch Mitteilungen von Ereignissen - so z. B., wenn kget etwas herunterlädt und wenn es damit fertig ist). Und zur Auswahl habe ich verschiedene Stimmen in deutsch - männlich oder weiblich, eine ist sogar mit einer leicht ins bayerische gehenden Sprachfärbung zu haben). Und für Suse 10.0 sind die Mbrola-Pakete sogar als RPM zu bekommen (über packman).

Die Behauptung stefan.tigers war daher falsch: Text-to-Speech-Programme sind unter Linux kein Problem mehr.

undefined
30.04.06, 14:59
Was Sprach Synthese unter Linux betrifft gibt es Open Sourse Projekte zu genüge. (mbrola/Festival/txt2pho/freephone/Hadifex etc.) Es gibt sogar einen Speziellen Kernel der darauf zielt.
http://www.butenuth.onlinehome.de/blinux/index-en.html
http://www.cstr.ed.ac.uk/projects/festival.html
Ich verwende Fetival und Mbrola wobei Mbrola einen besseren Akzent hat.

DictaTeam
01.09.09, 13:29
Moin Moin,

auch wen der Thread hier recht alt ist, so möchte ich doch kurz antworten. Ich bin bei einem Unternehmen tätig, das auf der MEDICA 2008 das erste Diktiersystem vorgestellt hat, das u.a. unter Linux läuft. dictate-on-demand läuft unter Linux, SUN Solaris, IBM AIX, HP UX, MAC und Windows.

In manchen Beiträgen wurde das digitale Diktat mit Spracherkennung gleichgestellt. Das ist leider falsch. Das digitale Diktat ist nichts anderes als das Aufzeichnen von Spache auf einem digitalen Speicherchip anstatt auf einer althergebrachten Kassette. Spracherkennung ist das Sprechen in ein Mikrofon und beten, dass der Text auf dem Bildschirm so angezeigt wird, wie er in das Mikrofon gesprochen wurde.

In der Tat ist es im Moment so, dass es noch kein marktrelevantes Spracherkennungssystem wie Dragon NaturallySpeaking unter Linux gibt. Mag sein, dass es eins gibt, das mir bei den Marktrecherchen nicht aufgefallen ist. Nachdem nun die drei wichtigsten windowsbasierten Produkte NaturallySpeaking, IBM Via Voice und Philips Speech Magic von Nuance geschluckt wurden, rechne ich persönlich auch nicht damit, das sich an der Situation in absehbarer Zeit etwas ändert. Nuance ist nur an Stückzahlen und EBIT-Marge interessiert.

Wen hier wirklich jemand ein Diktatsystem unter Linux sucht, dann kann er sich gerne an mich wenden. Wir realisieren aktuell unser erstes Diktatprojekt unter Suse Linux 10.x.

Newbie314
01.09.09, 14:44
Keine Kritik , nur ne Frage:

was ist der Unterschied zwischen einem Diktiersystem nach Eurer Definition (nur Aufzeichnung, keine Texterkennung , kein "Tippen" des gesprochenen Textes) und einer einfachen Aufnahme des Mikrophoneinganges mit Krecord oder Audacity ?

undefined
01.09.09, 16:10
Wenn ich seine Projektseite richtig gelesen habe, eine Spracherkennung nach DIN 5009. Kann so ein Projekt nur begrüßen, ist etwas, was schon lange auf Linux fehlt.

kegmeon
02.09.09, 21:43
Noch etwas, was zumindest in diese Richtung geht (sry falls zu off-topic):
Sprachsteuerung von KDE:
http://simon-listens.org/

claudius
02.09.09, 23:52
Funktioniert das denn halbwegs?

naraesk
03.09.09, 12:00
Mal anschauen, klingt interessant.
Aber da die aktuelle Version RC1 von 0.2 ist, würde ich nicht all zu viel erwarten.