Spaces:

bziiit
/

captation-audio

Running

App Files Files Community

cdupland commited on Sep 12

Commit

1abc475

verified ·

1 Parent(s): 2bfc369

Update README.md

Browse files

Files changed (1) hide show

README.md +87 -0

README.md CHANGED Viewed

@@ -45,3 +45,90 @@ Bien que ce code utilise l'API `MediaDevices` et `MediaRecorder`, il existe d'au
 * **API Web Audio** : Cette API est beaucoup plus avancée et offre un contrôle très granulaire sur le son. Elle est utile pour des tâches telles que la synthèse sonore, l'ajout d'effets (comme la réverbération), et la visualisation des ondes sonores.
 * **Élément `<audio>`** : Le plus simple de tous, cet élément HTML sert uniquement à la lecture de fichiers audio. Il est parfait pour une utilisation basique comme la lecture de l'enregistrement après l'arrêt, comme c'est le cas dans le code fourni.

 * **API Web Audio** : Cette API est beaucoup plus avancée et offre un contrôle très granulaire sur le son. Elle est utile pour des tâches telles que la synthèse sonore, l'ajout d'effets (comme la réverbération), et la visualisation des ondes sonores.
 * **Élément `<audio>`** : Le plus simple de tous, cet élément HTML sert uniquement à la lecture de fichiers audio. Il est parfait pour une utilisation basique comme la lecture de l'enregistrement après l'arrêt, comme c'est le cas dans le code fourni.
+### 🛠️ Intégration de l'API Whisper Côté Client
+Pour intégrer l'API OpenAI Whisper directement dans une page web, vous devez envoyer une requête **`POST`** en utilisant le format `multipart/form-data`. Le code HTML fourni est déjà configuré pour cela. Voici une note technique expliquant les modifications à apporter au code JavaScript pour réaliser l'appel.
+-----
+### 📝 Note Technique : Appel direct à l'API Whisper
+#### 1\. Préparation de la Requête
+L'API Whisper requiert deux éléments principaux dans le corps de la requête `multipart/form-data`:
+  * `file` : Le fichier audio à transcrire.
+  * `model` : Le nom du modèle à utiliser, qui doit être `"whisper-1"`.
+De plus, une **clé API** est nécessaire pour l'authentification. Elle doit être incluse dans l'en-tête de la requête sous la forme `Authorization: Bearer VOTRE_CLÉ_API`.
+#### 2\. Modification du Code JavaScript
+Pour adapter la fonction `sendAudioToApi` afin qu'elle envoie la requête directement à l'API Whisper, suivez ces étapes :
+a. **Mettez à jour l'URL de l'API.**
+L'endpoint de l'API Whisper est `https://api.openai.com/v1/audio/transcriptions` (pour la transcription) ou `https://api.openai.com/v1/audio/translations` (pour la traduction). Assurez-vous que l'URL dans la variable `endpoint` est correcte.
+b. **Construisez le corps de la requête.**
+Ajoutez le modèle `"whisper-1"` et le fichier audio (`blob`) au `FormData` que la fonction prépare déjà.
+c. **Ajoutez les en-têtes d'authentification.**
+L'en-tête `Content-Type` sera automatiquement géré par le navigateur pour le `multipart/form-data`, mais vous devez explicitement ajouter l'en-tête `Authorization`.
+Voici la fonction `sendAudioToApi` modifiée :
+```javascript
+async function sendAudioToApi(blob) {
+  // L'endpoint pour la traduction est https://api.openai.com/v1/audio/translations
+  const endpoint = "https://api.openai.com/v1/audio/translations";
+  const apiKey = "VOTRE_CLÉ_API_OPENAI"; // Mettez votre clé ici
+  if (!apiKey) {
+    setStatus("Clé API manquante. Impossible d'envoyer la requête.");
+    return;
+  }
+  setStatus("Envoi de l'audio à l'API OpenAI...");
+  const form = new FormData();
+  const extension = blob.type.includes('wav') ? 'wav' : (blob.type.includes('mpeg') ? 'mp3' : 'webm');
+  const filename = `recording-${Date.now()}.${extension}`;
+  form.append('file', blob, filename);
+  form.append('model', 'whisper-1');
+  try {
+    const response = await fetch(endpoint, {
+      method: 'POST',
+      headers: {
+        'Authorization': `Bearer ${apiKey}`,
+      },
+      body: form,
+    });
+    if (!response.ok) {
+      const errorData = await response.json();
+      setStatus(`Échec de l'envoi : ${response.status} - ${errorData.error.message}`);
+      throw new Error('Échec de l\'envoi');
+    }
+    const result = await response.json();
+    setStatus('Envoi réussi');
+    if (result && result.text) {
+      displayTranscription(result.text);
+    } else {
+      log('Aucune transcription trouvée dans la réponse de l\'API');
+    }
+    return result;
+  } catch (err) {
+    setStatus('Erreur lors de l\'envoi à l\'API');
+    console.error(err);
+    throw err;
+  }
+}
+```
+**Remarque** : Si vous souhaitez faire une traduction au lieu d'une transcription, utilisez l'endpoint `https://api.openai.com/v1/audio/translations`. La structure de la requête reste la même. L'API retourne un objet JSON avec la clé `"text"` contenant la transcription ou la traduction.