Anfordern von automatischen Untertiteln

In diesem Thema wird erklärt, wie Sie die Generierung von Untertiteln aus Audiospuren in Ihrem Video mithilfe der Dynamic Ingest API anfordern können.

Einleitung

Brightcove Auto Captioning ist ein Service auf Plattformebene, mit dem Sie automatisch Untertitel für neue oder vorhandene Videos in 31 verschiedenen Sprachen erstellen können (vorausgesetzt, Sie verfügen über eine Audiospur für die angegebene Sprache). Wie alle Sprache-zu-Text-Dienste ist Auto Captioning nicht 100 % genau, aber es bietet eine schnelle und einfache Möglichkeit, Untertitel direkt in Video Cloud zu erstellen.

Video Cloud verwendet den folgenden Prozess, um die Quelle zu bestimmen, die für die Erstellung der Untertitel verwendet wird.

  • Wenn das Video eine Standard-Audiospur hat, wird diese als Quelldatei für die Untertitel verwendet (standardmäßig im Medienmodul unterstützt)
  • Wenn das Video keine Standard-Audiospur hat, aber eine Master-/Mezzanine-Datei existiert, wird diese als Quelldatei verwendet (standardmäßig im Medienmodul unterstützt)
  • Wenn das Video keine Standard-Audiospur oder Master-/Mezzanine-Dateien hat, aber Audiospuren im Dynamic-Ingest-Aufruf angegeben sind, wird die angegebene Audiospur verwendet (noch nicht im Medienmodul unterstützt)
  • Wenn das Video keine Standard-Audiospur, keine Master-/Mezzanine-Dateien hat und keine Audiospur angegeben ist, können keine Untertitel erstellt werden

Einrichtung

Die Konfiguration für Dynamic Ingest Anfragen ist dieselbe, unabhängig davon, ob Sie ein Video, Bilder, Audiotracks, WebVTT Dateien aufnehmen, automatische Untertitel anfordern oder all dies:

Anfrage-URL
https://ingest.api.brightcove.com/v1/accounts/{account_id}/videos/{video_id}/ingest-requests
Authentifizierung
Für die Authentifizierung ist ein Zugriffstoken erforderlich, das als Bearer Token in einem Authorization Header übergeben wird:
      Authorization: Bearer {access_token}

Um Zugriffstoken zu erhalten, benötigen Sie Kundenanmeldeinformationen (siehe unten). Informationen zum Abrufen eines Zugriffstokens finden Sie unter Zugriffstoken erhalten.

Hinweis zu S3

Wenn Ihre Quelldateien aus einem geschützten S3-Bucket abgerufen werden, müssen Sie eine Bucket-Richtlinie festlegen, um dies zuzulassen Video Cloud um auf die Dateien zuzugreifen. Sehen Verwenden von Dynamic Ingest mit S3 für Details.

Anmeldeinformationen erhalten

Um ein client_id und zu erhalten client_secret, müssen Sie zur OAuth UI gehen und diese App registrieren:

Dies sind die Berechtigungen, die Sie benötigen:

Dynamische Aufnahme Berechtigungen
Dynamic Ingest Berechtigungen

Sie können Ihre Zugangsdaten auch über CURL, Postman, oder unsere Online-App abrufen — siehe:

Wenn Sie Anmeldeinformationen direkt von der API erhalten, benötigen Sie dies die Berechtigungen:

[
  "video-cloud/video/all",
  "video-cloud/ingest-profiles/profile/read",
  "video-cloud/ingest-profiles/account/read",
  "video-cloud/upload-urls/read"
]

Anwendungsfälle

Hier sind einige typische Anwendungsfälle

Erstellen von automatischen Untertiteln für neue Aufnahmen oder Retranscoding

Anfragetext
{
  "master": {
    "use_archived_master": true
  },
  "profile": "multi-platform-standard-static-with-mp4",
  "transcriptions": [
    {
      "srclang": "EN-us",
      "kind": "captions",
      "label": "English",
      "status" : "published",
      "default": true
    }
  ],
  "priority": "normal"
}

Erstellen von automatischen Untertiteln beim Einlesen einer Audiospur

Anfragetext
{
  "audio_tracks": {
    "merge_with_existing": true,
    "masters": [
        {
            "language": "fr-FR",
            "variant": "alternate",
            "url": "https://support.brightcove.com/test-assets//audio/celtic_lullaby.m4a"
        }
    ]
  },
  "transcriptions": [
      {
          "srclang": "fr-FR",
          "kind": "captions",
          "label": "french-FR",
          "status" : "published",
          "default": false,
          "input_audio_track": {
              "language": "fr-FR",
              "variant": "alternate"
          }
      }
  ]
}

Erstellen von automatischen Untertiteln für ein vorhandenes Video unter Verwendung des digitalen Masters

Anfragetext
{
  "transcriptions": [
      {
          "srclang": "fr-FR",
          "kind": "captions",
          "label": "french-FR",
          "default": false
      }
  ]
}

Erstellen von automatischen Untertiteln für ein vorhandenes Video mit Definition der Audiospuren

Anfragetext
{
  "transcriptions": [
      {
          "srclang": "en-US",
          "kind": "captions",
          "label": "english-EN",
          "default": false,
          "input_audio_track": {
              "language": "en-US",
              "variant": "main"
          }
      },
      {
          "srclang": "fr-FR",
          "kind": "captions",
          "label": "french-FR",
          "default": false,
          "input_audio_track": {
              "language": "fr-FR",
              "variant": "alternate"
          }
      }
  ]
}

Abfrage von Textfeldern für automatische Beschriftungen

Die nachstehende Tabelle zeigt die Felder des Anfragekörpers für automatische Beschriftungen.

Felder für automatische Untertitel und Transkripte
Feld Typ Erforderlich Beschreibung
autodetect boolescher Wert nein true um die Sprache aus der Audioquelle automatisch zu erkennen. false zu verwenden, um die Audiosprache srclang anzugeben.
default boolescher Wert nein Wenn true, srclang wird ignoriert und die Haupt-Audiospur wird verwendet — die Sprache wird automatisch erkannt.
input_audio_track Objekt nein Bei mehreren Tonspuren legen Sie fest, aus welchem Ton die Beschriftungen extrahiert werden sollen. Sie setzt sich zusammen aus Sprache und Variante (beides erforderlich).
kind Schnur nein Die Art der zu erzeugenden Ausgabe. Erlaubte Werte:
  • Bildunterschriften
  • abschriften
Hinweise:
  1. Wenn die Art Transkripte ist und die URL für die Transkriptionsdatei enthalten ist, wird eine Transkriptionsdatei aufgenommen, und es werden keine automatischen Untertitel erzeugt. Weitere Informationen finden Sie unter Aufnahme von Transkriptionen.
  2. Wenn die Art Transkripte ist und die URL für die Transkriptdatei nicht enthalten ist, werden eine Transkriptdatei und Untertitel erzeugt,
  3. Wenn der Typ Untertitel ist, wird ein Untertitel erzeugt, aber keine Abschriftdatei.
label Schnur nein Von Menschen lesbares Etikett. Standardmäßig wird der Sprachcode nach BCP-47 verwendet.
srclang Schnur nein BCP-47-Sprachcode für die Textspuren (en-US, fr-FR, es-ES, usw.); siehe unterstützte Sprachen
status Schnur nein Zeigt die tatsächliche Situation der Bildunterschrift an, falls ja published, draft.
url Schnur nein Die URL, unter der sich eine Transkriptionsdatei befindet. Muss in der Art ist Transkripte enthalten sein. Darf nicht enthalten sein, wenn es sich um Beschriftungen handelt.

input_audio_track Felder

input_audio_track Felder
Feld Typ Erforderlich Beschreibung
language Schnur Ja BCP-47-Sprachcode für die Textspuren (en-US, fr-FR, es-ES, usw.); siehe unterstützte Sprachen
variant Schnur Ja Gibt die zu verwendende Variante an:
  • main
  • alternate
  • dub
  • commentary
  • descriptive

Unterstützte Sprachen

Derzeit sind die automatischen Untertitel auf die folgenden Sprachen beschränkt

  • Australisches Englisch (en-AU)
  • Afrikaans (af-ZA)
  • Brasilianisches Portugiesisch (pt-BR)
  • Britisches Englisch (en-GB)
  • Kanadisches Französisch (fr-CA)
  • Dänisch (da-DK)
  • Niederländisch (nl-NL)
  • Farsi Persisch (fa-IR)
  • Französisch (fr-FR)
  • Deutsch (de-DE)
  • Arabisch für den Golf (ar-AE)
  • Hebräisch (he-IL)
  • Indisches Englisch (en-IN)
  • Indisches Hindi (hi-IN)
  • Indonesisch (id-ID)
  • Irisches Englisch (en-IE)
  • Italienisch (it-IT)
  • Japanisch (ja-JP)
  • Koreanisch (ko-KR)
  • Malaiisch (ms-MY)
  • Mandarin-Chinesisch - Festland (zh-CN)
  • Mandarin-Chinesisch (Taiwan) (zh-TW)
  • Modernes Standardarabisch (ar-SA)
  • Neuseeländisches Englisch (en-NZ)
  • Portugiesisch (pt-PT)
  • Russisch (ru-RU)
  • Schottisches Englisch (en-AB)
  • Südafrikanisches Englisch (en-ZA)
  • Spanisch (es-ES)
  • Schweizerdeutsch (de-CH)
  • Tamilisch (ta-IN)
  • Telugu (Te-in)
  • Thailändisch (th-TH)
  • Türkisch (tr-TR)
  • US-Englisch (en-US)
  • US-Spanisch (es-US)
  • Walisisch Englisch (en-WL)