Häufig gestellte Fragen

Erste Schritte

Was genau ist transcriptfy?

transcriptfy ist ein automatischer Transkriptionsdienst, der deine Audio- und Videodateien per KI in Text umwandelt. Du lädst eine Datei hoch, wir verarbeiten sie in Sekunden und liefern dir den Text mit Zeitstempeln, Sprechererkennung und Export in mehreren Formaten.

Gemacht für Journalisten, Podcaster, Forscher, Juristen, Studierende und alle, die zu viel Zeit damit verbringen, von Hand abzutippen, was jemand gesagt hat.

Muss ich ein Konto erstellen, um es auszuprobieren?

Nein. Du kannst eine Probe von bis zu 30 Sekunden ohne Registrierung transkribieren — das ist der Gast-Modus. Überzeugt dich das Ergebnis und willst du die komplette Datei verarbeiten oder den Editor nutzen, fragen wir dich erst dann nach einem Konto. Bei der Registrierung wird die bereits begonnene Transkription automatisch deinem Konto zugeordnet — du verlierst nichts.

Wie lade ich eine Datei hoch?

Auf der Startseite hast du zwei Wege:

Lokale Datei: Zieh die Datei in den Upload-Bereich oder klick, um sie von deinem Gerät auszuwählen.
Von URL: Füg den Link der Plattform ein, auf der das Audio oder Video liegt (z. B. YouTube), und wir laden es für dich herunter.

Bevor du auf „Transkribieren" klickst, kannst du die Quellsprache festlegen (oder bei automatischer Erkennung lassen) und Optionen wie Sprechererkennung oder eine anschließende Übersetzung aktivieren.

Wie lange dauert eine Transkription?

Das hängt von der Dauer der Datei und den aktivierten Optionen ab — in den meisten Fällen ist eine 30-minütige Datei in 1 bis 3 Minuten transkribiert. Optionen wie Sprechererkennung oder Übersetzung verlängern die Zeit etwas. Vor dem Start zeigen wir dir eine Geschwindigkeitsschätzung.

Transkription

Welche Dateiformate werden akzeptiert?

Die gängigsten Audio- und Videoformate: MP3, WAV, M4A, AAC, OGG, OPUS, WMA, FLAC für Audio; MP4, MOV, MKV, WebM, AVI, WMV für Video. Bei Videos extrahieren wir die Tonspur automatisch — du musst nichts vorab konvertieren.

Wie groß darf eine Datei maximal sein?

Das hängt von deinem aktiven Abo ab: 2 GB pro Datei und 1 Datei pro Vorgang im Gastmodus oder mit kostenlosem Konto; bis zu 5 GB pro Datei und 3 gleichzeitige Dateien mit jedem aktiven Abo-Paket. Ist deine Aufnahme größer, teil sie auf oder schreib uns — dann schauen wir uns deinen Fall an.

Welche Sprachen werden unterstützt?

Über 99 Sprachen, darunter Deutsch, Englisch, Spanisch, Französisch, Portugiesisch, Italienisch, Mandarin, Japanisch, Arabisch sowie alle wichtigen europäischen und asiatischen Sprachen. Standardmäßig erkennt das System die Sprache automatisch mit über 95 % Genauigkeit, du kannst sie aber auch manuell festlegen — das verbessert die Qualität bei sehr kurzen oder verrauschten Aufnahmen.

Erkennt ihr mehrere Sprecher?

Ja. Mit aktivierter Option Sprecher erkennen markieren wir automatisch, wer gerade spricht. Das funktioniert zuverlässig bis etwa 10 verschiedene Sprecher. Im Editor kannst du sie anschließend umbenennen („Sprecher 1" → „Anna Martínez"), und die Änderung greift in der gesamten Transkription.

Wie genau ist die Transkription?

Bei klaren Audios in Deutsch oder Englisch mit nur einem Sprecher liegen wir bei 95–98 % Genauigkeit. Sie sinkt bei starken Akzenten, mehreren überlappenden Sprechern, Hintergrundgeräuschen oder Musik. Unser Editor ist genau dafür gedacht, die wenigen verbleibenden Fehler zu korrigieren — ohne dass du ganze Absätze neu schreiben musst.

Editor

Kann ich die Transkription korrigieren?

Ja. Jede abgeschlossene Transkription hat einen Bearbeiten-Tab, in dem du den Text Wort für Wort anpassen kannst. Es ist Klartext-Bearbeitung — Segment- und Sprecherstruktur bleiben erhalten. Beim Speichern legen wir eine Version im Verlauf an — du verlierst die Originalversion nie.

Was ist der Bearbeitungsverlauf?

Jedes Mal, wenn du Änderungen im Editor speicherst, archivieren wir den vorherigen Stand als Version. In einem seitlichen Panel siehst du alle Versionen mit Datum, einer Kurzfassung der Änderung und einem Button, um die gewünschte Version wiederherzustellen.

Kann ich beim Bearbeiten das Audio anhören?

Ja. Alle Tabs des Editors (Transkription, Bearbeiten, Übersetzen, Zusammenfassung) teilen sich einen Audio-Player am unteren Rand. Klick auf eine Zeile mit Zeitstempel und das Audio springt exakt dorthin. Der Player stoppt nicht beim Tab-Wechsel — er läuft weiter, wo er war.

Kann ich die Datei oder die Sprecher umbenennen?

Ja, beides. Den Dateinamen änderst du über das Stift-Symbol in der oberen Leiste. Sprecher werden im Transkriptions-Tab umbenannt — wenn du „Sprecher 1" in „Maria" änderst, wird das in der gesamten Transkription, Übersetzung und Zusammenfassung übernommen. Umbenennungen landen ebenfalls im Bearbeitungsverlauf.

Übersetzung

Kann ich meine Transkription übersetzen?

Ja. Sobald die Transkription abgeschlossen ist, geh in den Tab Übersetzen und wähl die Zielsprache. Wir übersetzen Segment für Segment und behalten Zeitstempel und Sprecher bei. Den Fortschritt siehst du in Echtzeit — du musst nicht warten, bis alles fertig ist, um mitzulesen.

In wie viele Sprachen kann ich übersetzen?

Wir unterstützen über 20 gängige Zielsprachen. Du kannst mehrere Übersetzungen derselben Datei gleichzeitig aktiv haben (z. B. Deutsch → Englisch und Deutsch → Französisch). Jede wird separat verwaltet: Hinzufügen, Löschen und Herunterladen sind unabhängige Aktionen.

Wie sieht die Übersetzung aus?

In zwei Spalten nebeneinander: Original links, Übersetzung rechts. Beide Spalten scrollen synchron, und beim Hovern über ein Segment wird das passende Pendant in der anderen Spalte hervorgehoben. Über einen Toggle wechselst du zwischen Segment-Ansicht (zeilenweise mit Zeitstempel) und Absatz-Ansicht (gruppiert nach Sprecherwechsel oder längeren Pausen).

Kann ich die Übersetzung herunterladen?

Ja, in denselben Formaten wie das Original: TXT, SRT, VTT und JSON. Jeder Download trägt den Sprachcode im Dateinamen.

Automatische Zusammenfassung

Was beinhaltet die Zusammenfassung?

Vier Blöcke, die wir aus der Transkription erstellen:

Kurzfassung — 3 bis 5 Punkte, die das Wesentliche festhalten.
Kapitel — thematische Abschnitte mit Titel und klickbarem Zeitstempel (Klick und das Audio springt).
Wichtige Punkte — Zitate oder hervorgehobene Momente mit Zeitstempel.
Nach Sprecher — nur, wenn dein Audio zwei oder mehr Sprecher hat: Sprechzeit, Anzahl der Beiträge und individuelle Zusammenfassung.

Wie lange dauert die Erstellung?

Zwischen 30 Sekunden und 2 Minuten — je nach Länge der Transkription. Es geht schneller als die Übersetzung, weil wir den gesamten Text einmal verarbeiten und nicht Segment für Segment.

Kann ich die Zusammenfassung neu erstellen, wenn sie mir nicht gefällt?

Ja. Im Menü der Transkription gibt es „Zusammenfassung neu erstellen" — die alte wird gelöscht und eine neue gestartet. Praktisch, wenn du die Transkription nach der ersten Erstellung deutlich bearbeitet hast.

Exportieren und Herunterladen

In welchen Formaten kann ich exportieren?

TXT — Klartext, ohne Zeitstempel.
SRT und VTT — Standard-Untertitel für Video, kompatibel mit YouTube, Premiere, Final Cut und Webplayern.
JSON — vollständige Struktur mit Segmenten, Zeitstempeln, Sprechern und Metadaten. Ideal, wenn du die Daten in einem anderen Programm weiterverarbeiten willst.
Original-Audio — direkter Download der hochgeladenen Datei (praktisch, falls du sie auf deiner Festplatte verloren hast).

Verbraucht der Audio-Download mein transcriptfy-Datenkontingent?

Nein. Das Audio wird direkt aus unserem Speicher über eine temporäre signierte URL ausgeliefert — es läuft nicht über unser Backend. Schnell und ohne Auswirkung auf dein Kontingent.

Kann ich Dateien stapelweise herunterladen?

Aktuell nicht — jede Transkription wird einzeln im gewünschten Format heruntergeladen. Eine Verbesserung, die wir auf dem Schirm haben.

Konto und Zugang

Wie registriere ich mich?

Zwei Wege: E-Mail + Passwort oder Mit Google fortfahren. Der Google-Flow braucht nur eine Bestätigung — keine zusätzlichen Daten. In beiden Fällen erstellen wir dein Konto sofort und bringen dich in dein Dashboard.

Ich habe mein Passwort vergessen — wie bekomme ich es zurück?

Auf der Login-Seite gibt es „Passwort vergessen?" — du gibst deine E-Mail ein und wir schicken dir einen Link zum Zurücksetzen. Der Link läuft aus Sicherheitsgründen nach kurzer Zeit ab. Falls er nicht ankommt, schau im Spam-Ordner nach.

Kann ich die Sprache der Oberfläche ändern?

Ja, in den Einstellungen. Wir unterstützen Deutsch, Englisch, Spanisch, Französisch, Portugiesisch, Italienisch und Polnisch. Sie ist unabhängig von der Sprache, in der du transkribierst — du kannst die Oberfläche auf Deutsch nutzen und problemlos auf Spanisch transkribieren.

Kann ich eine Transkription löschen?

Ja, über das Menü jeder Transkription im Dashboard oder über das Kontextmenü im Editor. Beim Löschen entfernen wir Text, Übersetzungen, Zusammenfassung und das zugehörige Original-Audio. Diese Aktion ist nicht reversibel.

Gastmodus

Was kann ich ohne Registrierung tun?

Eine Probe von bis zu 30 Sekunden pro Datei transkribieren. Du siehst den Text und entscheidest dann, ob du mit der kompletten Datei weitermachen willst. Dafür musst du dich registrieren — sobald du das tust, wird die Probe deine erste komplette Transkription, ohne dass du den bisherigen Fortschritt verlierst.

Warum verlangt ihr beim Hochladen eine Verifizierung?

Weil wir ohne Registrierung sonst keine Möglichkeit haben, automatisierten Missbrauch zu verhindern. Wir setzen Cloudflare Turnstile ein — eine unsichtbare oder fast unsichtbare Verifizierung, die in den meisten Fällen bestätigt, dass du eine echte Person bist, ohne dir ein nerviges CAPTCHA vorzusetzen.

Wie lange bewahrt ihr meine Datei auf, wenn ich mich nicht registriere?

Audio und Transkription im Gastmodus werden 24 Stunden nach dem Upload gelöscht. Willst du deine Arbeit länger behalten, registriere dich vor Ablauf — dann wird die Transkription mit deinem Konto verknüpft und nicht automatisch gelöscht.

Abo und Zahlungen

Welche Tarife gibt es?

Wir arbeiten mit einem Modell aus Minutenpaketen: Du wählst das Paket, das am besten zu deinem Monatsvolumen passt, und zahlst einen Preis pro Minute, der mit größerem Paket sinkt. Welche Pakete verfügbar sind, der Preis pro Minute und die enthaltenen Funktionen findest du im Detail auf der Preisseite. Dort bündeln wir alles, damit du immer die aktuelle Übersicht hast.

Wie wird bezahlt?

Per Karte über Stripe. Wir akzeptieren Visa, Mastercard, American Express und europäische Karten mit 3D Secure. Die Abrechnung erfolgt regelmäßig (monatlich) und du kannst sie jederzeit über die Einstellungen kündigen.

Kann ich das Paket wechseln?

Ja, jederzeit über Einstellungen → Abo → Tarif verwalten. Wie die Änderungen angewendet werden (sofort oder zum Zyklusende), zeigen wir dir vor der Bestätigung im selben Modal — so siehst du genau, was du wann zahlst, bevor du zustimmst.

Was passiert, wenn ich kündige?

Du behältst den vollen Zugriff auf dein Paket bis zum Ende des bereits bezahlten Abrechnungszyklus. Am Ende dieses Zyklus wird das Abo inaktiv — bisherige Transkriptionen verlierst du nicht, du kannst nur keine neuen Minuten mehr verbrauchen, bis du ein anderes Paket buchst.

Wo sehe ich meine Zahlungen und Kontodaten?

Alles rund um dein Abo — aktives Paket, nächste Abbuchung, Zahlungsverlauf und Kontodaten — findest du unter Einstellungen → Abo.

Wie sehe ich, wie viele Minuten mir bleiben?

Auf derselben Abo-Seite gibt es einen Verbrauchsbalken, der die verbrauchten gegenüber den verfügbaren Minuten im aktuellen Zyklus zeigt. Er aktualisiert sich, sobald du eine Transkription abschließt.

Sicherheit und Datenschutz

Wo werden meine Dateien gespeichert?

Bei Cloudflare R2 — verschlüsselt im Ruhezustand, Zugriff nur über temporäre signierte URLs. Der Upload aus deinem Browser geht direkt in den Speicher, ohne Umweg über Zwischenserver, in denen die Datei offen liegen könnte.

Verwendet ihr meine Transkriptionen zum Training von KI-Modellen?

Nein. Dein Inhalt gehört dir — wir nutzen ihn nicht zum Training und geben ihn auch nicht an Dritte weiter, abgesehen von der Verarbeitung, die nötig ist, um die von dir angefragte Transkription, Übersetzung oder Zusammenfassung zu erstellen.

Wie schützt ihr mein Konto?

Passwörter speichern wir gehasht (nie im Klartext), Sitzungs-Cookies tragen die Flags secure und httpOnly, und sensible Endpoints sind durch Rate-Limiting geschützt. Wir empfehlen ein langes, einzigartiges Passwort — oder besser: per Google anmelden und Google den zweiten Faktor managen lassen.

Kann ich meine DSGVO-Rechte ausüben?

Ja. Du hast das Recht auf Auskunft, Berichtigung, Löschung, Datenübertragbarkeit und Widerspruch gegen die Verarbeitung deiner Daten. Details und Kanäle findest du in unserer DSGVO-Richtlinie — du kannst uns jederzeit schreiben, um sie geltend zu machen.

Ich habe noch Fragen

Wie kann ich den Support kontaktieren?

Über die Kontaktseite kannst du uns eine Nachricht schicken. Wir antworten zu europäischen Geschäftszeiten — meistens noch am selben Werktag. Bei Vorfällen, die deine Arbeit blockieren, gib bitte die ID der Transkription an (du siehst sie in der URL, wenn du sie geöffnet hast).

Gibt es eine API, um transcriptfy in meine Anwendung zu integrieren?

Aktuell bieten wir keine stabile öffentliche API an. Wenn du einen konkreten Integrationsfall hast, schreib uns über die Kontaktseite — wir prüfen das im Einzelfall.

Was mache ich, wenn ich einen Bug finde?

Darüber freuen wir uns. Schreib uns über die Kontaktseite und beschreib, was du gemacht hast, was du erwartet hattest und was tatsächlich passiert ist. Bugs mit Reproduktionsschritten sind Gold wert — sie wandern vor allen anderen in die Warteschlange.