IPS is Doel en funksies van inligtingherwinningstelsels
IPS is Doel en funksies van inligtingherwinningstelsels

Video: IPS is Doel en funksies van inligtingherwinningstelsels

Video: IPS is Doel en funksies van inligtingherwinningstelsels
Video: Locomotive Services 2024, November
Anonim

Dit is moeilik vir 'n moderne mens om die lewe sonder die internet en byna onmiddellike toegang tot inligtingsbronne voor te stel. Die gebruiker dink selde oor hoe die soektog na die gewenste inhoud op die netwerk uitgevoer word. Maar dit is baie interessant.

'n Inligtingherwinningstelsel (IPS) is 'n komplekse sagteware- en hardewarestelsel wat inligting op die gebruiker se versoek kies. Inligting word in digitale vorm op bedieners gestoor, soos boeke vroeër op die rakke van biblioteke was. Die stelsel bestaan uit baie subsisteme. Elkeen voer sy taak uit in die proses om die gebruiker se versoek te verwerk en aan hom inligting in teks- of klankvorm te verskaf. Die veelheid van take wat opgelos moet word, bepaal die kompleksiteit van die argitektuur van moderne inligtingherwinningstelsels ('n afkorting van die inligtingherwinningstelsel). 'n Soort "swart boks": by die invoer - die teks van die versoek, wat binne is - is onbekend, by die uitvoer - omvattende inligting.

Kaartlêer in die werklike lewe
Kaartlêer in die werklike lewe

Invoerstrome

Versoeke vir inligting wat 'n persoon in teksvorm op die skerm van sy gadget vorm,vorm 'n klein deel van die versoeke wat deur die soekenjin verwerk word. Die hoofreekse soeknavrae word gevorm deur robotte wat 'n menslike versoek aanvaar en 'n multi-stap soektog en terugvoer met die gebruiker uitvoer. Inligtingherwinningstelsels sluit bekende Google, Yandex en ander in, wat daagliks miljoene versoeke verwerk.

Bronsoekvoorwerpe

Die stel aanvanklike voorwerpe van belang vir die soektog is dokumente, rekords, video's, beelde en meer. Hulle word buite die IPS geskep. Die algemene inligtingstoor- en herwinningstelsel moet 'n ingeboude bibliografiese stelsel hê - 'n soort katalogus wat jou toelaat om na enige soort voorwerpe te soek.

Voorwerpe of hul digitale transformasies word 'n "toegangsbron" tot die IPS. Dit is onder hulle dat die inligting wat die gebruiker benodig gekies word.

Soek inligting
Soek inligting

Eksterne bronne

Inligtingskeuse-aansig gebruik eksterne kennisbronne. Dit is die inligting waarna die gebruiker soek. Die titel van die fliek, 'n aanhaling uit die boek, en meer. Vir 'n rekenaarsoektog moet hierdie inligting in 'n navraag in 'n algoritmiese taal vertaal word. In die IPS word dit gedoen deur die blok vir die skep, indeksering en ontwikkeling van navrae te gebruik.

Ideaal gesproke behoort hierdie drie prosesse-voorstelling, indeksering en navraagontwikkeling-op identiese bronne van kennis staat te maak, maar in die praktyk is dit nie haalbaar nie.

Kennisbronne moet voortdurend hersien en bygewerk word, en die opdatering moet identies wees engesinchroniseer. En 'n eksterne bron van kennis gaan altyd chronologies die gebruik daarvan in soekenjins vooraf vir 'n navraag, soms met etlike jare.

Inligtingherwinningstelsel
Inligtingherwinningstelsel

Optredes

Voorstellings van die oorspronklike voorwerpe word saamgestel uit invoerdata in een of ander kombinasie of getransformeer in ooreenstemming met die reëls en algoritmes van 'n spesifieke inligtingherwinningstelsel.

Views is min of meer getransformeerde kopieë van die oorspronklike soekobjek. In die versameling ongeredigeerde voltekste is elke teks sy eie voorstelling. In die versameling van voorwerpe van museumuitstallings en artefakte kan die voorstelling 'n getransformeerde beskrywing van die voorwerp met sy beeld wees. In sommige gevalle kan die voorstelling deels van die oorspronklike objek en deels van die beskrywing afgelei word: in bibliografiese soekenjins word voorstellings van die objek afgelei – byvoorbeeld titel, outeur se naam sal gekombineer word met die annotasie van die werk.

Om te vind wat jy nodig het
Om te vind wat jy nodig het

Soekbare indeks

Aangesien inligting in inligtingherwinningstelsels in die vorm van 'n voorstelling gestoor word, is dit logies om te aanvaar dat die soektog volgens die voorstelling uitgevoer word en, na seleksie, aan die gebruiker gegee word. In die praktyk is dit nie die geval nie. Byvoorbeeld, die huidige aanlyn biblioteekkatalogusse beperk gewoonlik soektogte tot 'n paar velde: skrywer, titel en onderskrifte binne 'n aansig wat ander velde bevat wat nie gesoek word nie. Dit is voldoende rede waarom dit nodig is om te onderskei'n aansig en 'n soekbare indeks, wat die soekgedeelte van die aansig is. Dit definieer alles wat soekbaar moet wees. 'n Soekbare indeks, soos die aansig en bronvoorwerp, kan in aparte sub-indekse verdeel word om meer presiese, geteikende soektogte te verskaf

Soekenjins het gewoonlik 'n sintetiese struktuur intern om geldige soekresultate te pas. Hierdie struktuur is die tweede komponent van die soekbare indeks.

Prosessioneel kan die indekseringsproses op verskillende maniere geïmplementeer word: 'n soekbare indeks kan verkry word deur:

  • kopieer letterlik 'n soekbare voorstelling;
  • deur die aansigbesonderhede te kopieer. Dit kan 'n deel van of al die aansigte wees wat fisies slegs as fragmente bestaan, versprei volgens die reëls vir die skep van 'n indeks vir soek, wat ingesamel sal word wanneer nodig.
Soekbestuur
Soekbestuur

Versoek ontwerpreëls en formele versoeke

Navraag-ingenieurswese is 'n funksie wat tussen 'n gebruikernavraag en 'n formele navraag bemiddel. Dit transformeer die gebruiker se navraag en pas dit met die herwinningsbevelwoordeboeke, indeksspesifikasie en indeks voor herwinning. Met die aanbreek van die ontwikkeling van IPS is hierdie rol tradisioneel aan gekwalifiseerde IT-spesialiste toegeken.

Die ontwikkeling van rekenaarnavrae wat woordeboeknavrae kan pas by 'n soekbare indeksstelsel word algemeen na verwys as die "woordeboekinvoer"-module. Outomatisering van hierdie funksie is belowend en bied geleenthede vir kundige en probabilistiese soekmetodes.

'n Formele versoek word 'n formele versoek nadat die gebruiker se versoek omgeskakel is. Voorbeelde van sulke formele transformasies sluit in afkapping, vervanging, normalisering, vektorisering en ander transformasies van die "eksterne" voorstelling in die "interne" voorstellings van rekenaar IPS (dekripsie - inligtingherwinningstelsel)..

Uitgetrekte dokumentskakelstelle

Die gevolglike stel inligtingsbronne is logieserwys 'n subset van die aansigte wat geskep word deur die ooreenstemmende reëls wat toegepas word op die formele navraag deur 'n soekbare indeks.

Gewoonlik, maar nie noodwendig nie, is daar 'n aparte sorteerproses vir die herwin stel inligting. Aanlyn biblioteekkatalogusse herrangskik gewoonlik ontvangde stelle alfabeties volgens skrywer voordat dit vertoon word. In inligtingherwinningstelsels wat streng rangorde produseer, gaan rangorde enige herrangskikking vooraf.

Data-analise
Data-analise

Uitvoerstrome

Uitvoer van soekresultate word tradisioneel op die skerm gedoen, meer dikwels in die vorm van 'n stroom voorwerpe wat elders of vir 'n ander doel gebruik word, voltooi die hoofsoeklus. Sulke strome kan na visualiseringstoestelle gestuur word, berging vir verdere verwerking, of gebruik as invoerstrome na ander seleksiedienste.

Inligtingherwinningstelsels laat terugvoer vandie uitset van enige keuringsproses. Die uitset van enige proses kan terugvoer na ander prosesse wees. Terugvoer kan op enige stadium die basis vir deskundige oordeel verskaf.

Aanbeveel: