Disiz Yyov
Posts
🧠Un réseau social 100% IA va débarquer

🧠Un réseau social 100% IA va débarquer

Disiz Yyov & Inès Carion
21st août 2023

🧠Un réseau social 100% IA débarque

https://j2mmlwu2zwm.typeform.com/to/TNxyalNS?typeform-source=app.beehiiv.com

Ecrire un article

Dans l’édition d’aujourd’hui :

🌎 Nvidia Crée Un Nouveau Métavers

🧠Un réseau social 100% IA va débarquer

🎵 L'IA recrée un extrait de chanson de Pink Floyd à partir d'enregistrements de l'activité cérébrale

🌎 Nvidia Crée Un Nouveau Métavers

Nvidia a encore une fois volé la vedette en IA avec 2 nouvelles annonces qui ont mis le domaine de l'IA en émoi.

La dernière est la plus folle, Nvidia prévoit de surpasser Meta avec ce qu'ils appellent "L'Omniverse."

Mais commençons par la première.

Annonce #1 - Nvidia est sur le point de lancer une nouvelle puce IA

À moins que vous n'ayez vécu sous une roche, vous savez que nous sommes en pleine crise des puces IA.

Chaque modèle IA a besoin de puces IA, et le principal producteur de ces puces (Nvidia) est à court. En bref, nous avions besoin de cette puce.

Son nom ?

Le GH200 Grace Hopper Superchip et c'est une BÊTE de puce avec 3 fois plus de mémoire.

Toute cette mémoire permet aux développeurs d'exécuter des modèles plus grands sur moins de puces et d'économiser plus d'argent. C'est bénéfique pour tous.

Annonce #2 - Nvidia envisage de lancer leur version du Métavers appelée L'Omniverse.

Pensez au Métavers comme un monde où vous pouvez virtuellement passer du temps avec des amis ou assister à un concert.

L'Omniverse est comme un méga parc qui contient des milliers de Métavers.

L'objectif de Nvidia est de créer un endroit où l'IA peut en apprendre davantage sur le monde, mais aussi où nous pouvons expérimenter des choses sans en subir les effets.

Non seulement la technologie IA va progresser encore plus rapidement avec la nouvelle puce IA, mais la recherche scientifique et architecturale le fera aussi, c’est dingue.

Source

🧠Un réseau social 100% IA débarque !

Et ce réseau s’appelle : BEFAKE

L'ancien PDG de MZ lance BeFake (appstore, googleplay), une application de médias sociaux basée sur l'IA qui offre de nouvelles façons de se connecter avec des amis grâce à des visuels générés par l'IA.

L'application fonctionne exactement comme BeReal, mais avec une différence. Contrairement à BeReal, cette application permet aux utilisateurs d'imaginer et de se placer dans n'importe quel scénario créatif en utilisant l'IA. Les utilisateurs peuvent soit utiliser les prompts textuels pré-faits de l'application, soit entrer les leurs pour concevoir leur image.

Source

🎵 L'IA recrée un extrait de chanson de Pink Floyd à partir d'enregistrements de l'activité cérébrale

L'extrait audio de 15 secondes ressemble à une version boueuse d'une chanson de Pink Floyd, comme si quelqu'un la chantait sous l'eau. Sauf que Pink Floyd n'a joué aucune des musiques dans l'extrait.

Au lieu de cela, la piste a été créée par une équipe de chercheurs de l'Université de Californie à Berkeley, qui ont examiné l'activité cérébrale de plus de deux douzaines de personnes ayant écouté la chanson.

Ces données ont ensuite été décodées par un modèle IA et reconstruites en audio, marquant la première fois que des chercheurs ont pu recréer une chanson à partir de signaux cérébraux.

Peut-être que, dans le futur, cela pourrait potentiellement être utilisé pour communiquer avec d'autres animaux.

Source

🔧 Les 6 meilleurs outils IA de la semaine

☛ Eightify extrait les idées principales de longues vidéos Youtube. Il utilise GPT et sa propre technologie pour améliorer la qualité des résumés et prendre en charge des vidéos allant jusqu'à 32 heures. De plus, le temps moyen de génération n'est que de 8 secondes.

☛ Speechflow est un modèle d'IA qui convertit l'audio en texte ponctué, optimisé pour la lisibilité. Il prend en charge 14 langues, revendique une précision 20% supérieure à celle de ses concurrents, et peut traiter une heure d'audio en moins de 3 minutes à un coût de 0,0002 $/seconde. Il dispose d'une API simplifiée et se intègre facilement grâce à des extraits de code concis.

☛ Hurd.ai utilise l'IA pour permettre une écoute attentive pendant les conférences, ateliers et réunions. Assieds-toi pendant que Hurd.ai capture, transcrit, résume et étiquette votre contenu. Contrairement à d'autres qui facturent à l'heure, son plan gratuit offre des enregistrements illimités et sécurisés.

☛ Roll est une plateforme vidéo basée sur l'IA, qui permet aux utilisateurs de créer des vidéos captivantes en utilisant seulement un smartphone et un navigateur. Elle propose des visuels de qualité cinéma, un audio de premier ordre, des effets multi-caméras et VFX, des montages audio, un éditeur Roll, et une publication universelle. En exploitant l'IA et l'apprentissage automatique, Roll automatise la production vidéo pour des résultats professionnels rapides et économiques.

☛ VectorShift est une plateforme sans code qui permet aux entreprises de créer des applications IA génératives. Accède à des pipelines pré-construits tels que des générateurs de documents, des chatbots, et plus encore, ou crée des solutions personnalisées.

☛ VPN gratuit pour Chrome est Un service VPN facile à utiliser pour te protéger lorsque tu navigues sur Internet mais aussi pour accéder à Claude.ai.

🧠 Les recherches IA à lire absolument

📄 TeCH : Reconstruction de figures humaines vêtues réalistes guidée par du texte

L'article présente une approche révolutionnaire pour générer des modèles humains 3D vêtus, détaillés et réalistes à partir d'images uniques. La méthode utilise une combinaison de prompts textuels descriptifs et d'un modèle de diffusion Texte-vers-Image (T2I) pour une reconstruction précise. En extrayant des détails visibles et indescriptibles, TeCH réalise des intricatés, textures et géométries. Il utilise une représentation 3D hybride et un échantillonnage par distillation de score (SDS) pour l'optimisation. TeCH dépasse les méthodes existantes en qualité de rendu et en précision géométrique, démontrant son potentiel pour diverses applications. Cette technique innovante comble le fossé entre la guidance textuelle et la génération humaine 3D, ouvrant la voie à des applications plus larges au-delà des corps humains.

📄 Apprendre à identifier les états critiques pour l'apprentissage par renforcement à partir de vidéos

L'article présente une approche novatrice qui identifie les états pivots dans l'apprentissage par renforcement (RL) à partir de données vidéo. Abordant les défis de compréhension des points de décision en RL, le cadre Deep State Identifier comprend un prédicteur de retour et un détecteur d'état critique. Cette méthode innovante extrait des informations significatives des trajectoires visuelles, améliorant le comportement de l'agent et la comparaison des politiques. Contrairement aux travaux précédents, il fonctionne sans information d'action explicite, améliorant l'interprétabilité en RL. Des expériences extensives valident son efficacité dans divers environnements, soulignant son potentiel pour le RL hiérarchique. L'approche offre une perspective unique sur le RL explicable, démontrant son potentiel pour améliorer les performances de l'agent et simplifier les processus d'explication.

📄 Résoudre des problèmes mathématiques complexes à l'aide de l'interpréteur GPT-4 avec auto-vérification basée sur le code

L'article présente l'interpréteur GPT-4 Code (GPT4-Code) pour résoudre des problèmes mathématiques complexes. GPT-4 Code génère et exécute du code Python pour améliorer le raisonnement et la résolution de problèmes. L'étude analyse sa fréquence d'utilisation du code et révèle ses capacités d'auto-débogage, attribuant son succès à la génération de code dynamique. Une nouvelle technique d'auto-vérification basée sur le code (CSV) est proposée, guidant GPT-4 Code pour vérifier et rectifier les solutions à l'aide du code. L'approche atteint une impressionnante précision en situation inédite (53,9% → 84,3%) sur le jeu de données MATH, surpassant les méthodes précédentes. Cette recherche approfondit la compréhension du raisonnement renforcé par le code dans les LLMs et contribue à de nouveaux jeux de données pour améliorer les capacités mathématiques.

📄Enseigner aux LLMs à personnaliser - Une approche inspirée par l'éducation à l'écriture

Réalisée par une équipe de chercheurs de Google et de l'Université du Michigan, cette approche présente une méthodologie polyvalente pour doter les LLMs de la capacité de personnaliser la création de contenu. Reflétant les étapes de l'instruction d'écriture, le nouveau cadre englobe une architecture multi-étapes englobant la récupération, le classement, la résumé, la synthèse et la génération. De plus, la compétence en lecture du modèle est améliorée par un cadre multitâche, similaire à l'interconnexion des compétences en lecture et en écriture dans l'éducation. Les résultats expérimentaux sur divers jeux de données confirment l'efficacité de l'approche, promettant une nouvelle ère de génération de texte sur mesure.

📄 Avatar neuronal relightable et animable à partir d'une vidéo à vue éparse

Des chercheurs de l'Université de Zhejiang, du MIT Media Lab et de Image Derivative Inc. présentent une approche novatrice pour construire des avatars neuronaux relightables et animables à partir de vidéos à vue éparse (ou monoculaire) d'humains dynamiques. Le nouveau cadre permet la génération d'avatars qui sont non seulement animables, mais également adaptables à différentes conditions d'éclairage, un exploit difficile. Grâce à un astucieux algorithme de requête de distance hiérarchique (HDQ), les méthodes calculent efficacement les intersections de surface et la visibilité de la lumière, facilitant un relighting réaliste. Les expériences montrent les performances supérieures de l'approche, offrant une voie prometteuse pour la représentation virtuelle humaine dynamique et réaliste.

Que pensez-vous de la newsletter d'aujourd'hui ?

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.