A palavra -chave no contexto (KWIC) é o formato mais comum para linhas de concordância. O termo Kwic foi cunhado pela primeira vez por Hans Peter Luhn. O sistema foi baseado em um conceito chamado palavras -chave em títulos que foi proposto pela primeira vez para as bibliotecas de Manchester em 1864 por Andrea Crestadoro.
Um índice KWIC é formado pela classificação e alinhamento das palavras dentro do título do artigo para permitir que cada palavra (exceto as palavras de parada) nos títulos seja pesquisável em ordem alfabética no índice. Era um método de indexação útil para manuais técnicos antes que a pesquisa de texto completo computadorizado se tornasse comum.
Por exemplo, uma consulta de pesquisa, incluindo todas as palavras em uma definição de exemplo ("Kwic é um acrônimo para a palavra -chave no contexto, o formato mais comum para linhas de concordância") e o slogan da Wikipedia em inglês ("a enciclopédia livre"), pesquisado contra uma página da Wikipedia, pode produzir um índice KWIC como segue. Um índice KWIC geralmente usa um amplo layout para permitir a exibição do máximo de informações 'no contexto' (não mostrado no exemplo a seguir).
KWIC is anacronym for Key Word In Context, ...page 1... Key Word In Context, the mostcommon format for concordance lines.page 1... the most common format forconcordance lines.page 1... is an acronym for Key Word InContext, the most common format ...page 1Wikipedia, The FreeEncyclopediapage 0... In Context, the most commonformat for concordance lines.page 1Wikipedia, TheFree Encyclopediapage 0KWIC is an acronym forKey Word In Context, the most ...page 1 KWIC is an acronym for Key Word ...page 1... common format for concordancelines.page 1... for Key Word In Context, themost common format for concordance ...page 1 Wikipedia, The Free Encyclopediapage 0KWIC is an acronym for KeyWord In Context, the most common ...page 1Um índice KWIC é um caso especial de um índice permutado. Este termo refere -se ao fato de indexar todas as permutações cíclicas dos títulos. Livros compostos por muitas seções curtas com seus próprios títulos descritivos, principalmente coleções de páginas manuais, geralmente terminavam com uma seção de índice permutada, permitindo que o leitor encontre facilmente uma seção por qualquer palavra de seu título. Essa prática, também conhecida como Palavra -chave fora do contexto (KWOC), não é mais comum.
Palavra -chave ao lado do contexto (KWAC)
Palavra -chave no contexto (KWIC)
Palavra -chave fora do contexto (KWOC)
Nota: A primeira referência não mostra o índice KWIC, a menos que você pague para visualizar o documento. A segunda referência nem sequer liste o artigo.
David L. Parnas uses a KWIC Index as an example on how to perform modular design in his paper On the Criteria To Be Used in Decomposing Systems into Modules, available as an ACM Classic PaperChristopher D. Manning and Hinrich Schütze describe a KWIC index and computer concordancing in section 1.4.5 of their book Foundations of Statistical Natural Language Processing. Cambridge, Mass: MIT Press, 1999. ISBN 9780262133609. They cite an article from H.P. Luhn from 1960, "Key word-in-context index for technical literature (kwic index)".According to Rev. Gerard O'Connor's Concordantia et Indices Missalium Romanorum, "Most of the concordances produced in recent times and with the aid of computer software use both the KWIC (keyword in context) and KWICn (keyword in center) formats, which lists the keyword, usually highlighted in bold text in a consistent position, within a limited amount of context text, i.e. three [or] four words of the text prior to the keyword and the same amount of text following. This format is extremely useful in that the keyword is easily identified together with its context. ... The Concordance of the Roman Missal is produced in both the KWIC and KWICn formats and is noteworthy in that each word form is listed as it appears in the text, that is, it is un-lemmatized."