エピソード

  • IA e a Web: Como ChatGPT, Gemini e Claude Aprendem e se Atualizam – Desvendando o RAG!
    2025/09/15

    O episódio "IA: Como os modelos se atualizam?" explora como os modelos de inteligência artificial (IA) e os mecanismos de busca obtêm e processam informações, desmistificando a ideia de que as IAs varrem a web em tempo real para cada resposta. O autor apresenta respostas detalhadas do Gemini, ChatGPT e Claude, que explicam seus respectivos processos de treinamento. As IAs revelam que são treinadas em vastos conjuntos de dados pré-processados (como Common Crawl ou C4) de forma offline e periódica, diferentemente dos crawlers de busca tradicionais (como o Googlebot), que indexam a web continuamente. Para buscas generativas, é empregado um processo como o Retrieval-Augmented Generation (RAG), onde informações relevantes são recuperadas de índices de busca atualizados e, em seguida, sintetizadas pelo modelo de linguagem para gerar uma resposta coesa, com as fontes citadas. Em resumo, há uma distinção clara entre a coleta de dados para treinamento da IA e os algoritmos usados para buscas tradicionais e generativas, embora todos dependam da vasta "biblioteca" da web.

    続きを読む 一部表示
    16 分
  • Tokens e Embeddings no SEO: Conceitos Essenciais da IA
    2025/09/08

    Neste episódio falamos sobre a diferença entre tokens e embeddings, conceitos fundamentais em Inteligência Artificial (IA) e Modelos de Linguagem de Grande Escala (LLMs) que impactam o SEO. Tokens são unidades textuais básicas, como palavras, usadas na busca tradicional por palavras-chave (lexical), enquanto embeddings (densos) são representações numéricas que capturam o significado e o contexto semântico das palavras. A fonte destaca que, historicamente, a busca era baseada em frequência de palavras com embeddings esparsos, mas a evolução para embeddings densos permitiu uma compreensão mais profunda do significado, melhorando a relevância dos resultados. Modelos como RankBrain, BERT e MUM são apresentados como exemplos da integração de embeddings na busca do Google, culminando na busca híbrida, que combina abordagens lexical e semântica para lidar com consultas complexas e informações fora do domínio de treinamento de um modelo, oferecendo uma recuperação de informação mais abrangente.

    続きを読む 一部表示
    15 分
  • Resolvendo a ambiguidade semântica
    2025/09/01

    Todos nós sabemos que a comunicação humana é intrícada, gosto de pensar nela como uma tapeçaria de sentidos e significados, que todo dia é tecida com finos fios de sutileza, contexto e intenção. Essa imagem se construiu na minha mente depois que eu joguei um video game chamado South of Midnight. Nesse jogo existe o conceito da Tecelagem, que são como fios invisíveis que nos ligam e que são interrompidos ou bloqueados por nossos traumas.


    Esse episódio foi criado com base nesse artigo Resolvendo a ambiguidade semântica - Blog Semânticousando o NotebookLM do Google para resumir as ideias do artigo.

    続きを読む 一部表示
    23 分
  • Além dos Links Azuis: Como a Busca Online Virou Semântica, com IA e Biblioteconomia
    2025/08/29

    No podcast do Blog Semântico, Alexander Rodrigues Silva, especialista em SEO Semântico com mais de duas décadas de experiência e formação em Biblioteconomia, apresenta resumos dos seus artigos. Descubra como a IA potencializa insights sobre taxonomias, ontologias e a revolução da busca, conectando o futuro do SEO às Ciências da Informação. Uma visão aprofundada para otimizar a informação na Web.


    Esse podcast 'e produzido com o uso de Inteligência Artificial com base nos artigos escritos no Blog Semântico por mim, Alexander Rodrigues Silva

    続きを読む 一部表示
    20 分