Cursos online

Converse com seus documentos

Se você é dev e quer aprender um pouco mais desse conjunto de técnicas para criar aplicações baseada em LLMs, considere comprar o minicurso “Converse com seus Documentos Usando LLM”, disponível por apenas R$ 99.

Nesse curso, abordamos aspectos teóricos e práticos do desenvolvimento de aplicações baseadas em LLMs, como:

  • O que são e como criar embeddings

  • Como selecionar dados relevantes nos seus documentos

  • Como integrar seus dados com uma LLM.

Interessou? Acessa aqui o conteúdo.


Entendendo Embeddings

Na era digital atual, a quantidade de dados gerados e consumidos é imensa, e grande parte desses dados é textual.

Para criar aplicações baseadas em LLMs, é preciso processar textos vindos de diversas fontes. No entanto, modelos de aprendizado de máquina não processam texto diretamente em sua forma bruta; eles requerem uma conversão desses textos em um formato que possam entender: os vetores numéricos. É aqui que os embeddings desempenham um papel crucial.

Embeddings são representações que capturam não apenas a frequência das palavras, mas também o contexto em que são usadas. Esta técnica permite que máquinas interpretem e processem a linguagem humana de uma maneira que reflete seu verdadeiro significado e uso, tornando-os ferramentas indispensáveis em uma variedade de aplicações de processamento de linguagem natural (PLN).

Com embeddings, é possível realizar diversos tipos de tarefas. Por exemplo, sistemas de recomendação podem usar embeddings para entender melhor as preferências do usuário através de análises de comentários e descrições de produtos, enquanto chatbots virtuais dependem de embeddings para processar e responder a consultas de forma eficaz e contextualizada.

Conhecer e utilizar técnicas de embeddings é fundamental para qualquer pessoa interessada em criar aplicações baseadas em LLMs.

Conteúdo

Alguns dos conceitos apresentado nesse curso, são:

  • Métodos tradicionais para converter textos em vetores numéricos

  • Embeddings e sua capacidade de guardar contexto

  • Diferença entre modelos de embeddings e vetores numéricos

  • Hello world na criação de embeddings usando a OpenAI

  • Comparando vetores usando métodos de similaridade

  • Utilizando o ChromaDB para melhorar robustez da busca de dados similares

Interessou? Acesse o conteúdo completo aqui.

Dominando estratégias de chunking