Please use this identifier to cite or link to this item: https://demo.dspace.keep.pt/123456789/214
Title: Automated watch for digital preservation
Other Titles: Automatização da vigilância de preservação digital
Authors: Faria, Luís Francisco da Cunha Cardoso de
Advisor: Ramalho, José Carlos
Ferreira, José Miguel Araújo
Issue Date: 28-Sep-2017
Abstract: The current extensive growth of digitally created documents is an obvious effect of the global tendency towards the digital technology. Replacing paper with digital documents has become a common activity in all kinds of public institutions and businesses, on which many already completely eradicated the use of paper and other analogue media. European policies, such as eGovernment, urge for the public administration to cease the use of analogue media and provide all services and documentation in digital form. But documents in digital form are much more perishable than their paper counterparts and it is not obvious for the users that keeping a digital document accessible for several decades is a very different task than safekeeping paperbased documents. Furthermore, some aspects that a user will consider maintained when keeping the physical form of the paper do not behave the same way when the information is in digital form. Authenticity is one of these aspects, and it is crucial in some domains where the information has no value to be kept if the power to serve as evidence is lost. The digital preservation field tries to tackle all these problems. The main problem in digital preservation relates with the ever-changing technological environment with which the documents must be compatible to be accessible by users. Part of the solution must include the detection of these changes by continuously monitoring the documents, their users, and the technological, organisational, financial, legal, social and even political environment, to detect preservation threats. However, the volume and heterogeneity of documents make manual monitoring of all relevant aspects of the world infeasible. Moreover, current practice is limited to monitoring influencers of a very reduced set of domains, specifically file format obsolescence, ignoring others that might introduce threats. This work focuses on creating automatic and systematic ways to monitor the environment on a wide set of domains and provide a valuable input for digital preservation threat detection and assessment. It does so by inquiring the community about their view on the preservation threat importance and the methods used to effectively detect and monitor the threats. Then, an approach for automatic threat detection is laid out and implemented, focusing on the most important and neglected threats. Finally, the approach is validated against real world problems, proving to be a successful approach for scalable and automatic preservation watch.
O elevado crescimento do número de documentos criados digitalmente nos últimos anos, é um claro efeito da atual tendência global para a utilização da tecnologia digital. A substituição do papel pelo formato digital nas instituições e empresas tornou-se comum, sendo certo que algumas delas erradicaram já a utilização do papel e outros suportes analógicos do seu quotidiano. As políticas europeias que têm vindo a ser adotadas — tal como o Governo Eletrónico — incentivam a administração pública a abandonar a utilização de suportes analógicos, substituindo-os pelo formato digital, tendo as entidades públicas passado a prestar os seus serviços e a disponibilizar a documentação de forma eletrónica. Todavia, os documentos em formato digital são mais efémeros que os seus análogos em papel, não sendo, contudo, óbvio para o utilizador comum que a preservação de um documento digital por dezenas de anos seja uma tarefa muito diferente da conservação de documentos em papel. Na verdade, algumas características que o utilizador comum considera implicitamente preservadas ao conservar a forma física do papel, não permanecem do mesmo modo quando a informação é mantida em formato digital: a autenticidade é uma dessas características, sendo crucial nos domínios em que o valor da informação é proporcional ao seu valor probatório. O principal problema da preservação digital prende-se com a volatilidade do ambiente tecnológico e com o qual os documentos necessitam de manter compatibilidade. Parte da solução deverá passar pela monitorização destas mudanças, através da vigilância contínua dos documentos, dos seus utilizadores e também do ambiente tecnológico, organizacional, financeiro, legal, social e até político, de modo a detetar quais as ameaças à preservação dos documentos. Contudo, o volume e heterogeneidade dos documentos digitais tornam impraticável a monitorização de todos os fatores externos relevantes para a preservação digital. Aliás, atualmente a monitorização é limitada à análise de influências pertencentes a um conjunto reduzido de domínios, especialmente ligados à obsolescência de formatos, ignorando outros que podem revelar ameaças à preservação dos documentos. O presente trabalho dedica-se ao estudo de mecanismos sistemáticos e automáticos de monitorização do ambiente num conjunto alargado de domínios e de modo a fornecer a informação necessária para a deteção e avaliação das ameaças à preservação digital. Primeiramente, a comunidade é inquirida sobre a sua perspetiva quanto à importância das várias ameaças à preservação digital e quais os métodos utilizados para detetar se tais ameaças afetam o conteúdo digital. De seguida, é apresentada uma nova abordagem para deteção automática de ameaças à preservação do conteúdo digital, focalizada nas ameaças mais importantes e negligenciadas. Finalmente, a nova abordagem é validada perante cenários reais, provando, assim, ser uma proposta viável de monitorização automática para a preservação digital.
Description: Doctorate Thesis (Doctoral Program on Informatics)
URI: https://demo.dspace.keep.pt/123456789/214
Document Type: Doctoral Thesis
Appears in Collections:KEEPS - Teses de doutoramento

Files in This Item:
There are no files associated with this item.


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.