Repositório de metadados

Content

Definição

O repositório de metadados é responsável por armazenar e catalogar fisicamente metadados. Os dados em um repositório de metadados devem ser genéricos, integrados, atuais e históricos. Genérico: o Meta Model deve armazenar os metadados por termos genéricos, em vez de armazená-lo por uma maneira definida específica de aplicativos, de modo que, se o seu padrão de base de dados mudar de um produto para outro, o modelo físico do repositório de metadados não precisará mudar. A integração do repositório de metadados permite que todos os metadados das áreas de negócios sejam de maneira integrada: cobrindo todos os domínios e áreas de assunto da organização. O repositório de metadados deve ter metadados atuais e históricos acessíveis. Os repositórios de metadados costumavam ser referidos como um dicionário de dados.

Com a transição de necessidades para o uso de metadados para a inteligência de negócios, o escopo do repositório de metadados aumentou. Os dicionários de dados anteriores são o lugar mais próximo para interagir a tecnologia com os negócios. Os dicionários de dados são o universo do repositório de metadados nos estágios iniciais, mas à medida que o escopo aumentou o glossário dos negócios e suas tags para variedade de sinalizadores de status surgiram no lado dos negócios, enquanto o consumo dos metadados da tecnologia, sua linhagem e vínculos fizeram o repositório, a fonte para a fonte para Relatórios valiosos para reunir negócios e tecnologia e ajudaram as decisões de gerenciamento de dados mais fáceis, além de avaliar o custo das alterações.

O repositório de metadados explora a governança de dados ampla corporativa, a qualidade dos dados e o gerenciamento de dados mestre (inclui dados mestre e dados de referência) e integra essa riqueza de informações com metadados integrados em toda a organização para fornecer sistema de suporte à decisão para estruturas de dados, mesmo que reflita apenas o estruturas consumidas de vários sistemas.

Repositório vs. Registro

Artigo principal: registro de metadados

O repositório possui funcionalidades adicionais em comparação com o registro. O repositório de metadados não apenas armazena metadados como o registro de metadados, mas também adiciona relacionamentos com os tipos de metadados relacionados. Os metadados quando relacionados em um fluxo de seu ponto de entrada na organização até as entregas são consideradas como a linhagem desse ponto de dados. Os metadados quando relacionados em outros tipos de metadados relacionados são chamados de ligações. Ao fornecer os relacionamentos a todos os pontos de metadados em toda a organização e manter sua integridade com uma arquitetura para lidar com as alterações, o repositório de metadados fornece o material básico para entender o fluxo de dados completo e suas definições e seu impacto. Além disso, o recurso importante é manter o controle da versão, embora essa declaração para contrastar esteja aberta para discussão. Essas definições ainda estão evoluindo; portanto, a precisão das definições precisa de refinamento.

O objetivo do registro é definir o elemento de metadados e mantido em toda a organização. E modelos de dados e outras equipes de gerenciamento de dados se referem ao registro para obter alterações a seguir. Enquanto os metadados do repositório de metadados são metadados de vários sistemas de metadados nas organizações e refletem o que está no upstream. O repositório nunca atua como um upstream, enquanto o registro é usado como um upstream para alterações de metadados.

Razão para uso

O repositório de metadados permite toda a estrutura dos contêineres de dados da organização em um local integrado. Isso abre uma infinidade de informações engenhosas para tomar decisões de negócios calculadas. Essa ferramenta usa uma forma genérica de modelo de dados para integrar todos os modelos, portanto, traz todos os aplicativos e programas da organização em um formato. Além disso, a aplicação das definições de negócios e processos de negócios aproxima os negócios e a tecnologia que ajudarão as organizações a fazer roteiros confiáveis ​​com objetivos definitivos. Com informações de uma parada, os negócios terão mais controle sobre as alterações e podem causar análise de impacto da ferramenta. Geralmente, os negócios gastam muito tempo e dinheiro para tomar decisões com base na descoberta e pesquisa sobre impactos para fazer alterações ou adicionar novas estruturas de dados ou remover estruturas no gerenciamento de dados da organização. Com um repositório estruturado e bem conservado, mover o produto da ideação para a entrega leva o mínimo de tempo (considerando que outras variáveis ​​são constantes). Resumindo:

Integration of the metadata across the organization.Build relationship between various metadata typesBuild relationship between various disparate systems.Define business golden copy of definitions.Version control of the changes at structure level.interaction with Reference datalink view to master data.automatic synchronization with various authorized metadata source systems.More control to business decisions.validate the structures by overlapping the modelsdiscovering discrepancies, gaps, lineage, metrics at data structure level.

Cada sistema de gerenciamento de banco de dados (DBMS) e ferramentas de banco de dados têm seu próprio idioma para os componentes de metadados. Os aplicativos de banco de dados já possuem seus próprios repositórios ou registros que devem fornecer toda a funcionalidade necessária para acessar os dados armazenados. Os fornecedores não querem que outras empresas sejam capazes de migrar facilmente dados para longe de seus produtos e entre os produtos dos concorrentes, para que sejam proprietários com a maneira como lidam com metadados. Ferramentas de casos, dicionários de DBMS, ferramentas ETL, ferramentas de limpeza de dados, ferramentas OLAP e ferramentas de mineração de dados, todas manipulam e armazenam metadados de maneira diferente. Somente um repositório de metadados pode ser projetado para armazenar os componentes de metadados de todas essas ferramentas.

Projeto

Os repositórios de metadados devem armazenar metadados em quatro classificações: propriedade, características descritivas, regras e políticas e características físicas. Propriedade, mostrando o proprietário dos dados e o proprietário do aplicativo. As características descritivas, definem os nomes, tipos e comprimentos e definições que descrevem dados de negócios ou processos de negócios. Regras e políticas definirão segurança, limpeza de dados, cronogramas para dados e relacionamentos. Características físicas definem a origem ou fonte e a localização física. Como a criação de um modelo de dados lógicos para criar um banco de dados, um meta modelo lógico pode ajudar a identificar os requisitos de metadados para dados comerciais. O repositório de metadados será centralizado, descentralizado ou distribuído. Um design centralizado significa que existe um banco de dados para o repositório de metadados que armazena metadados para todos os negócios de aplicativos. Um repositório de metadados centralizado tem as mesmas vantagens e desvantagens de um banco de dados centralizado. Mais fácil de gerenciar, porque todos os dados estão em um banco de dados, mas a desvantagem é que os gargalos podem ocorrer.

Um repositório de metadados descentralizado armazena metadados em vários bancos de dados, separados por local e ou departamentos da empresa. Isso torna o gerenciamento do repositório mais envolvido do que um repositório de metadados centralizado, mas a vantagem é que os metadados podem ser divididos em departamentos individuais.

Um repositório de metadados distribuído usa um método descentralizado, mas, diferentemente de um repositório de metadados descentralizado, os metadados permanecem em sua aplicação original. Um gateway XML é criado que atua como um diretório para acessar os metadados em cada aplicativo diferente. As vantagens e desvantagens para um repositório de metadados distribuídos refletem o de um banco de dados distribuído.

O design do modelo de informação deve incluir várias camadas de tipos de metadados a serem sobrepostos para criar uma visão integrada dos dados. Vários tipos de metadados devem ser costurados com elementos de metadados relacionados em um modelo de cima para baixo, ligando ao glossário dos negócios.

Camadas de metadados:

Business Glossary: contains recursive relationship to Business terms.Business tags: Contains various affiliation to that term or terms.Data Dictionary: contains information from data model tools for the definition of metadata elements and their technical definitions provided by data or enterprise architecture.Conceptual data models:Logical data modelsPhysical data modelsDatabasesvalidation rules and data quality rulesETL, business rules and their relationship to attributes and entitiesReportsSource to target mapping artifacts (relationships)Reporting requirements (relationships)business processes and their relationship to technologypeople hierarchy and their relationshipowner relationship

Relacionamento da entidade/orientado a objetos

Os repositórios de metadados podem ser projetados como um modelo de relação de entidades ou um design orientado a objetos.

Veja também

MetadataMetadata engineMetadata registryMetadata standardsISO/IEC 11179Data dictionaryData modeling