arrow_back

Transkripsi Speech to Text Menggunakan Cloud Speech API

Gabung Login
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Transkripsi Speech to Text Menggunakan Cloud Speech API

Lab 30 menit universal_currency_alt 1 Kredit show_chart Pengantar
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP048

Lab Mandiri Google Cloud

Ringkasan

Speech-to-Text API memungkinkan Anda mentranskripsikan file ucapan audio menjadi file teks dalam lebih dari 80 bahasa.

Di lab ini, Anda akan mengirim file audio ke Speech API untuk membuat transkripsinya.

Yang akan Anda pelajari

Di lab ini, Anda akan mempelajari hal berikut:

  • Membuat permintaan Speech-to-Text API dan memanggil API dengan curl
  • Memanggil Speech-to-Text API dengan file audio dalam bahasa lain

Penyiapan dan persyaratan

Sebelum mengklik tombol Mulai Lab

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.

Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.

Untuk menyelesaikan lab ini, Anda memerlukan:

  • Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
  • Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Jika Anda sudah memiliki project atau akun pribadi Google Cloud, jangan menggunakannya untuk lab ini agar terhindar dari tagihan ekstra pada akun Anda.

Cara memulai lab dan login ke Google Cloud Console

  1. Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan berikut ini:

    • Tombol Open Google Console
    • Waktu tersisa
    • Kredensial sementara yang harus Anda gunakan untuk lab ini
    • Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
  2. Klik Open Google Console. Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Login.

    Tips: Atur tab di jendela terpisah secara berdampingan.

    Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
  3. Jika perlu, salin Username dari panel Lab Details dan tempel ke dialog Sign in. Klik Next.

  4. Salin Password dari panel Lab Details dan tempel ke dialog Welcome. Klik Next.

    Penting: Anda harus menggunakan kredensial dari panel sebelah kiri. Jangan menggunakan kredensial Google Cloud Skills Boost. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
  5. Klik halaman berikutnya:

    • Setujui persyaratan dan ketentuan.
    • Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
    • Jangan daftar uji coba gratis.

Setelah beberapa saat, Cloud Console akan terbuka di tab ini.

Catatan: Anda dapat melihat menu dengan daftar Produk dan Layanan Google Cloud dengan mengklik Menu navigasi di kiri atas. Ikon menu navigasi

Tugas 1. Membuat Kunci API

Karena Anda menggunakan curl untuk mengirim permintaan ke Speech-to-Text API, Anda harus membuat Kunci API untuk meneruskan URL permintaan.

  1. Untuk membuat Kunci API, di Navigation menu (Ikon Navigation menu) klik APIs & services > Credentials.

  2. Klik Create credentials, lalu pilih API key.

  3. Salin dan catat kunci yang baru saja Anda buat untuk digunakan nanti di lab ini.

  4. Klik Close.

Klik Check my progress untuk memverifikasi tujuan.

Membuat Kunci API

Sekarang, simpan kunci di variabel lingkungan agar Anda tidak perlu memasukkan nilai Kunci API Anda dalam setiap permintaan.

  1. Untuk melakukan langkah selanjutnya, hubungkan ke linux-instance yang disediakan untuk Anda melalui SSH:

Di Navigation menu (Ikon Navigation menu), klik Compute Engine > VM Instances.

Perhatikan VM linux-instance dalam daftar VM instances. Anda dapat melihat detail VM di sebelah kanan nama VM.

  1. Klik SSH di sebelah kanan nama VM linux-instance.

Shell interaktif akan terbuka. Gunakan shell ini untuk menjalankan operasi selanjutnya.

  1. Dalam shell (SSH), jalankan perintah berikut dan ganti <your_api_key> dengan kunci yang baru saja Anda salin:
export API_KEY=<YOUR_API_KEY>

Tugas 2. Membuat permintaan API

Catatan: Lab ini menggunakan file yang telah direkam sebelumnya yang tersedia di Cloud Storage: gs://cloud-samples-data/speech/brooklyn_bridge.flac. Sebelum mengirimkannya ke Speech-to-Text API, Anda dapat memproses file ini.
  1. Buat permintaan ke API dalam file request.json: Buat file request.json:
touch request.json
  1. Buka file menggunakan editor command line pilihan Anda (nano, vim, emacs) atau gcloud, lalu tambahkan baris berikut ke file request.json, menggunakan nilai uri dari sampel file audio mentah:
{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-data/speech/brooklyn_bridge.flac" } }
  1. Simpan file sesuai kebutuhan.

Bagian isi permintaan memiliki objek config dan audio.

Dalam config, Anda memberi tahu Speech-to-Text API cara memproses permintaan tersebut:

  • Parameter encoding memberi tahu API jenis encoding audio yang Anda gunakan ketika file sedang dikirim ke API. FLAC adalah jenis encoding untuk file .raw (Pelajari lebih lanjut jenis encoding dari referensi RecognitionConfig).
  • languageCode secara default disetel ke dalam bahasa Inggris jika tidak disebutkan dalam permintaan.

Ada parameter lain yang dapat Anda tambahkan ke objek config, tetapi hanya encoding yang diperlukan.

Dalam objek audio, teruskan uri file audio yang tersimpan di Cloud Storage untuk lab ini ke API.

Klik Check my progress untuk memverifikasi tujuan.

Membuat permintaan Speech API

Sekarang Anda siap untuk memanggil Speech-to-Text API.

Tugas 3. Memanggil Speech-to-Text API

  1. Teruskan isi permintaan Anda beserta variabel lingkungan Kunci API ke API dengan perintah curl berikut (semua dalam satu command line):
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Respons Anda tersimpan dalam file bernama result.json.

  1. Untuk melihat isi file, Anda dapat menggunakan:
cat result.json

Respons yang ditampilkan oleh perintah curl akan terlihat seperti ini:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98216057 } ], "resultEndTime": "1.770s", "languageCode": "en-us" } ], "totalBilledTime": "15s" }

Nilai transcript menampilkan transkripsi teks Speech API dari file audio Anda, dan nilai confidence menunjukkan tingkat keyakinan API dalam mentranskripsikan audio Anda secara akurat.

Perhatikan bahwa Anda memanggil metode syncrecognize pada permintaan di atas. Speech-to-Text API mendukung transkripsi speech to text sinkron dan asinkron.

Contoh ini menggunakan file audio lengkap, tetapi Anda juga dapat menggunakan metode syncrecognize untuk melakukan streaming transkripsi speech to text saat pengguna sedang berbicara.

Klik Check my progress untuk memverifikasi tujuan.

Memanggil Speech API untuk bahasa Inggris

Tugas 4. Transkripsi Speech-to-Text dalam berbagai bahasa

Apakah Anda menguasai lebih dari satu bahasa? Speech-to-Text API mendukung transkripsi speech to text ke dalam lebih dari 100 bahasa.

Anda dapat mengubah parameter language_code di request.json. Anda dapat menemukan daftar bahasa yang didukung di Panduan dukungan bahasa.

Coba file audio dalam bahasa Prancis - (untuk pratinjaunya, dengarkan di sini).

  1. Edit request.json Anda, lalu ubah kontennya menjadi berikut:
{ "config": { "encoding":"FLAC", "languageCode": "fr" }, "audio": { "uri":"gs://cloud-samples-data/speech/corbeau_renard.flac" } }
  1. Panggil Speech-to-Text dengan menjalankan perintah curl lagi.

  2. Lihat hasilnya:

cat result.json

Anda akan melihat respons berikut:

{ "results": [ { "alternatives": [ { "transcript": "maître corbeau sur un arbre perché Tenait dans son bec un fromage maître Renard par l'odeur alléché lui tint à peu près ce langage et bonjour monsieur du corbeau", "confidence": 0.93855613 } ], "resultEndTime": "12.630s", "languageCode": "fr-fr" } ], "totalBilledTime": "15s" }

Ini adalah penggalan kalimat dari dongeng anak-anak Prancis populer karangan Jean de la Fontaine. Jika mempunyai file audio dalam bahasa lain, Anda dapat menambahkannya ke Cloud Storage dan mengubah parameter languageCode dalam permintaan Anda.

Catatan: Batas penggunaan dan pembatasan API pada Cloud Speech-to-Text didokumentasikan dalam Kuota dan batas resource. Memanggil Speech API untuk bahasa Prancis

Selamat!

Anda berhasil melakukan transkripsi speech to text dengan Speech API. Anda meneruskan Cloud Storage URI dari file audio Anda ke API dan meninjau alternatif penerusan string berenkode base64 dari konten audio.

Menyelesaikan Quest Anda

Lab mandiri ini merupakan bagian dari Quest Intro to ML: Language Processing dan Language, Speech, Text & Translation with Google Cloud APIs. Quest adalah serangkaian lab terkait yang membentuk jalur pembelajaran. Dengan menyelesaikan Quest, Anda mendapatkan badge sebagai pengakuan atas pencapaian Anda. Anda dapat menunjukkan satu atau beberapa badge kepada orang lain secara publik dan menautkannya di resume online atau akun media sosial Anda. Daftarkan diri Anda dalam Quest apa pun yang berisi lab ini dan segera dapatkan kredit penyelesaian. Lihat katalog Google Cloud Skills Boost untuk melihat semua Quest yang tersedia.

Ikuti lab berikutnya

Lanjutkan Quest Anda dengan Mengukur dan Meningkatkan Akurasi Ucapan atau coba salah satu dari berikut ini:

Langkah berikutnya/Pelajari lebih lanjut

Sertifikasi dan pelatihan Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 20 September 2023

Lab Terakhir Diuji pada 20 September 2023

Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.