Você já deve ter visto incontáveis variações deste desenho do Hugh MacLeod (@gapinvoid):
Replico o rabisco só para mostrar que é relativamente comum a representação do conhecimento como grafos ou uma rede. Falar em Knowledge Graphs é, de certa forma, uma redundância1. Deixemos os preciosismos de lado.
Knowledge Graphs (KGs) são usados por várias big techs (Google, Meta, LinkedIn…) como uma estratégia de organização e persistência de dados e informações. É uma ideia ousada porque de fato entende que aquela base representa conhecimento. Preciosismo de novo? É. Porque andamos muito permissivos, relaxados ou perdidos no uso de termos como conhecimento, inteligência etc.
Nós sabemos mais do que conseguimos dizer.
De novo: deixemos os preciosismos de lado. Porque as possibilidades abertas pelo conceito KG são boas e grandes demais para serem desperdiçadas por conta de alguns, vamos dizer, deslizes ontológicos.
Fiquei devendo um papo (sério) sobre ontologia e taxonomia. Para fechar aquela conversa sobre Data-Centric. Vamos lá.
Poucas coisas são tão burras quanto as nossas bases de dados tradicionais. Estou falando de quase todos os bancos de dados em praticamente todas as empresas. São burros burros burros de dar dó. E tamanho não é documento, pelo contrário. Quanto maior o banco, menor o QIB2. Esses depósitos, deixados por si sós, não têm valor nenhum. Eles não sabem nem explicam nada. Porque a gente só consegue entender o que está ali registrado através de aplicações (!) ou de quem desenvolveu essas aplicações (!!) ou da documentação técnica (!!!3). A alternativa data-centric não dá ponto sem nó:
Os dados são autodescritivos e não dependem de uma aplicação para interpretação e significado.
Os dados são expressos em formatos abertos e não proprietários.
Sim, eu sei que já tem um tempinho que se fala sobre metadados — os dados que explicam ou explicariam nossos dados. Já vi um monte de metadados que têm alguma utilidade para algum algoritmo. Estou para ver metadados conversando com gente4.
It's the stupid data.
Um departamento de TI viável, enxuto e ágil não vai existir em cima de uma camada estúpida. Depois de décadas gastando fortunas nas duas fatias de pão — arquitetura tecnológica e arquitetura de aplicações —, talvez seja hora de dar atenção para o recheio desse sanduíche, a Arquitetura de Informações.
E essa atenção passa, antes de qualquer coisa, por compreensão. Pela nossa compreensão. Nós precisamos conhecer esses ativos, os dados. Nós precisamos relacioná-los com as gentes e coisas do mundo real; Precisamos colocá-los em forma; para, enfim, conseguir usá-los com inteligência (humana ou não).
É curiosa e comovente a esperança de que uma IA da vida dê jeito em bases de dados mal e porcamente tratadas.
Praticamente todas as iniciativas Data-Centric passarão pelo mesmo gargalo: dar jeito nos dados e transformá-los naquilo que o quadrinho lá em cima chama de conhecimento. Nossas bases precisam ganhar sentido e organização. Enfim, ontologia e taxonomia dão as caras. Para horror dos puristas, vou arriscar definições bem, sei lá:
Ontologia6: é a estrutura formal; são as definições e classificações compreendidas naquele contexto, naquela indústria. Chato, eu acho que se a gente trabalhasse direito com MER, DDD, OO7 a ontologia estaria dada.
Taxonomia8: é a nossa conta de diversos9. Brincadeirinha. Ou não: porque aqui registramos as informalidades, os outros entendimentos e a evolução de nosso próprio entendimento. Não que a ontologia não deva ser igualmente viva e dinâmica. Ela é. Mas aqui a coisa é mais solta e, vamos dizer, ágil.
Alguém deve ter chegado até aqui esperando algum papo sobre OWL, RDF e coisa e tal. Não faltam boas fontes sobre isso. Portanto, nos poupe.
Mas não me poupe e pergunte: o que é que isso tudo tem a ver com Knowledge Graphs?
TUDO.

Na Base dos Sonhos
Um KG não tem a sua estrutura pré-definida por gênios, DBAs, analistas ou arquitetos. Se o mundo lá fora não para, como seria possível ou viável uma estrutura pré-fixada?
Praticamente todos os bancos da grande maioria de nossas empresas foram construídos assim, com a fixação de um modelo, de uma estrutura. Vira um deus-nos-acuda toda vez que uma mudança se torna inevitável. Porque altera as BASES, mexe nos alicerces dos sistemas. O tempo todo.
Os bancos e aplicações, assim como quase tudo que vemos em nossas organizações, foram concebidos a partir de uma lógica reducionista. Esses artefatos reforçam os silos que os criaram10. Por isso é curioso, para dizer o mínimo, que alguém recomende a geração de um KG a partir das estruturas das bases de dados legadas11.
O desenvolvimento de Knowledge Graphs é uma rara oportunidade de revisitar o próprio negócio usando novos óculos, criando e espalhando novos entendimentos e hábitos. Não faz muito sentido delegar esse sonho para terceiros e muito menos para um algoritmo. Não mesmo.
Cotação
O conhecimento é diferente de todos os outros recursos. Ele se torna constantemente obsoleto, de modo que o conhecimento avançado de hoje é a ignorância de amanhã. E o conhecimento que importa está sujeito a mudanças rápidas e abruptas.
Ivo Velitchkov, em Personal Knowledge Graphs: Connected thinking to boost productivity, creativity and discovery (Exapt Press, 2023)
Não perca tempo procurando. Acabei de inventar esse QIB (quibe): Quociente de Inteligência de uma Base de dados.
Cada exclamação vale um sorriso.
Eu sei, dev também é gente. Mas eu tô falando de outro tipo de gente.
Aos puristas: ONTOLOGIA, segundo o Dicionário de Filosofia do necessário Mario Bunge, é
A séria versão secular de metafísica. O ramo da filosofia que estuda as feições mais universais da realidade, tais como existência real, mudança, tempo, chance, mente e vida.
E não é que saiu um MERDDDOO?
Aos não técnicos:
MER: Modelo Entidade-Relacionamento
DDD: Domain-Driven Design
OO: Orientação a Objetos
Logo abaixo pintaram outras duas siglas:
Aos puristas, Bunge de novo:
TAXONOMIA é a metodologia da sistemática: a investigação dos princípios de classificação, particularmente na biologia.
Em contabilidade se vê nos quatro cantos de um bom plano de contas uma conta com este nome: Diversos. Sabe aquela despesa bem difícil de explicar? Então…
Tem um livro joia, escrito por uma antropóloga, que ilustra bem os efeitos dos silos e da mentalidade reducionista: The Silo Effect: The Peril of Expertise and the Promise of Breaking Down Barriers, de Gillian Tett (Simon & Schuster, 2015).
Em determinado momento, Tett sugere que as organizações desenvolvam o hábito de “refrescar” as suas taxonomias de tempos em tempos.
No artigo Building Knowledge Graph from Relational Database, de Bilal Ben Mahria, Ilham Chaker, and Azeddine Zahi, publicado em Semantic AI in Knowledge Graphs (CRC Press, 2023).
What would Drucker do?: Nurture great organizations and societies guided by Peter Drucker's best quotes - Niels Pflaeging (BetaCodex Press, 2023).