Data
2013-04
Embargo
Título da revista
ISSN da revista
Título do Volume
Editora
Instituto Politécnico do Porto. Escola Superior de Estudos Industriais e de Gestão (ESEIG)
Projetos de investigação
Unidades organizacionais
Fascículo
Título Alternativo
Resumo
Hoje em dia a Web sobrepôs-se a todos os outros meios de comunicação tornando-se o meio de comunicação principal para quem produz informação e para quem a consome. O seu crescimento é exponencial, pode-se dizer mesmo, assustador. Com este ritmo de crescimento e se continuarmos a produzir e a consumir informação da mesma forma, o que hoje tomamos como certo poderá deixar de sê-lo a curto prazo. Os arquivos digitais constituem um subdomínio da Web e estão neste ritmo de crescimento acelerado. A informação disponibilizada seja ela na forma de descrições, transcrições ou digitalizações cresce diariamente. A Web veio eliminar as barreiras geográficas mas se nada for feito no entretanto, encontrar o item que procuramos pode-se tornar uma tarefa difícil. Como a comunidade é muito proactiva a tecnologia já existe o que é preciso é dá-la a conhecer e aplicá-la aos vários domínios. Estamos a falar da Web Semântica ou Web 3.0 e que assenta na seguinte premissa: até à segunda geração da Web as máquinas limitavam-se a apresentar a informação, a interpretação da informação era tarefa exclusiva dos humanos, ou seja, às máquinas era pedido que apresentassem mais ou menos bonita a informação, uma tarefa fácil, aos humanos cabia a tarefa mais árdua e complexa; porque não colocar as máquinas a fazer parte do trabalho árduo? O que temos de alterar na nossa forma de produzir conteúdos para tornar este cenário possível? Estas são algumas das questões a que queremos dar resposta no contexto dos arquivos. De 1989 a 1991, decorreu no Arquivo Distrital de Braga, um projeto pioneiro nas suas ideias e objetivos, o projeto HiTeX. Em termos teóricos pretendia-se desenvolver um sistema capaz de registar, organizar e gerir informação de natureza histórica. Na prática, desenvolveu-se um sistema de apoio à transcrição de documentos históricos com algumas caraterísticas avançadas mesmo nos dias de hoje. Numa primeira fase o sistema assentava em classificadores de documentos por tipologia, que hoje estão refletidos nos agrupamentos de fundos (notariais, judiciais, administrativos, etc), se bem que na altura a árvore classificativa era bem mais profunda e descia ao nível do documento. Nos fundos documentais há 3 índices que são de extrema importância e que dão trabalho a criar: o cronológico (datas), o antroponímico (pessoas) e o toponímico (lugares). Numa segunda fase, o HiTeX enriqueceu a sua linguagem descritiva de modo a que estes índices fossem gerados automaticamente. Podemos ainda considerar uma terceira fase do projeto onde se acrescentaram classificadores semânticos à antroponímia e toponímia, i. e., não se indicava apenas que determinado nome pertencia a uma pessoa mas que essa pessoa era um bispo e que possuía uma série de relações com outras entidades do sistema (pessoas, lugares, documentos,...). No entanto, apesar de vanguardista o projeto HiTeX estava muito adiantado no tempo, em 1991 a descrição arquivística ainda não seguia uma norma, não havia bases de dados arquivísticas disponíveis e acessíveis, a tecnologia Web ainda não estava desenvolvida (a Internet começou a ser usada em Portugal em 1994), a semântica era ainda um campo de investigação a dar os primeiros passos. Hoje tudo mudou e todas estas dificuldades foram ultrapassadas. Nesta comunicação, iremos apresentar a fotografia atual da Web, as tecnologias que nos poderão ajudar a resolver este problema e o seu enquadramento e aplicabilidade no contexto dos arquivos. Neste contexto, em particular iremos discutir ideias que datam de 1990, o projeto HiTeX, pouco compreendidas na altura mas muito necessárias hoje e daremos uma panorâmica do que poderão vir a ser os arquivos digitais do futuro próximo se às tecnologias e práticas usadas atualmente nos arquivos juntarmos a tecnologia da Web Semântica.
Palavras-chave
Arquivo , Web semântica , Ontologia , Linked Open Data
Tipo de Documento
Apresentação em Conferência
Versão da Editora
Dataset
Citação
TID
Designação
Tipo de Acesso

Acesso Aberto

Apoio
Descrição