Muitos dados escuros não são estruturados, o que significa que as informações estão em formatos que podem ser difíceis de categorizar, sejam lidas pelo computador e, portanto, analisadas. Freqüentemente, a razão pela qual os negócios não analisam seus dados sombrios é devido à quantidade de recursos que levaria e a dificuldade de analisar esses dados. De acordo com a Computer Weekly, 60% das organizações acreditam que sua própria capacidade de relatório de inteligência de negócios é "inadequada" e 65% dizem que "têm" abordagens de gerenciamento de conteúdo um tanto desorganizadas ".
Os dados úteis podem se tornar dados escuros depois de se tornarem irrelevantes, pois não são processados com rapidez suficiente. Isso é chamado de "insights perecíveis" em "dados de fluxo ao vivo". Por exemplo, se a geolocalização de um cliente for conhecida por uma empresa, a empresa poderá fazer uma oferta com base no local, no entanto, se esses dados não forem processados imediatamente, poderá ser irrelevante no futuro. De acordo com a IBM, cerca de 60 % dos dados perdem seu valor imediatamente.
De acordo com o New York Times, 90% da energia usada pelos data centers é desperdiçada. Se os dados não foram armazenados, os custos de energia poderiam ser salvos. Além disso, existem custos associados à subutilização da informação e, portanto, às oportunidades perdidas. De acordo com a Datamation, "os ambientes de armazenamento das organizações da EMEA consistem em 54 % de dados escuros, 32 % de dados redundantes, obsoletos e triviais e 14 % de dados críticos dos negócios. Até 2020, isso pode adicionar US $ 891 bilhões em armazenamento e gestão que custam que os custos que de outra forma, pode ser evitado. "
O armazenamento contínuo de dados escuros pode colocar uma organização em risco, especialmente se esses dados forem sensíveis. No caso de uma violação, isso pode resultar em sérias repercussões. Isso pode ser financeiro, legal e pode prejudicar seriamente a reputação de uma organização. Por exemplo, uma violação de registros privados de clientes pode resultar no roubo de informações confidenciais, o que pode resultar em roubo de identidade. Outro exemplo pode ser a violação das informações confidenciais da empresa, por exemplo, relacionadas à pesquisa e desenvolvimento. Esses riscos podem ser atenuados avaliando e auditando se esses dados são úteis para a organização, empregando fortes criptografia e segurança e, finalmente, se estiver determinado a ser descartado, deve ser descartado de uma maneira que se torne inocente.
Considera -se geralmente que, à medida que os sistemas de computação mais avançados para análise de dados são construídos, maior será o valor dos dados escuros. Observou -se que "dados e análises serão a base da revolução industrial moderna". Obviamente, isso inclui dados atualmente considerados "dados escuros", pois não há recursos suficientes para processá -los. Todos esses dados que estão sendo coletados podem ser usados no futuro para trazer o máximo de produtividade e a capacidade das organizações atenderem à demanda dos consumidores. Os avanços tecnológicos estão ajudando a aproveitar esses dados sombrios, graças a empresas jovens e inovadoras, como Datumize, Veritas ou Lucidworks. Além disso, muitas organizações não percebem o valor dos dados escuros no momento, por exemplo, nas organizações de saúde e educação lidam com grandes quantidades de dados que poderiam criar um "potencial significativo para atender estudantes e pacientes da maneira como os serviços de consumidor e financeiro perseguir sua população -alvo ".