hvernig á að bæta skráningarlyklum við blackbox repacker


svara 1:
  • Fyrsta skrefið til að gera leik minni er eins og allir hér eru að segja .. „rífa“ .. (fjarlægja skrár sem eru ekki nauðsynlegar til að spila leikinn) flestir rippers fjarlægja allar stuðningsskrár sem eru margar tungumálar en ensku og skilja eftir textar þar sem þeir eru litlir, svo hvenær sem leikur kemur með segðu ensku hljóð eða þýsku eða ítölsku eða hvaðeina .. það þýðir að skráarsafnið þyrfti að hafa margar útgáfur af skrá fyrir þegar persóna / klippt atriði / fmv spilar, ef skráin á ensku er 10mb þá myndi mismunandi útgáfa af tungumáli bæta við 10mb fyrir hvert tungumál og það gæti verið bara fyrir persónu sem segir „Greetings player!“ ímyndaðu þér 5 mínútna fmv klippa senu í 1080p með 320bit hljóð (eða betra) skrárnar geta hoppað upp í nokkur GB bara fyrir intro mynd .. svo að fjarlægja allt nema enskt hljóð / myndband er fyrsta skrefið.
  • Næst endurskoða þeir: eins og ég sagði áður ímyndaðu þér 5 mínútna 1080p eða hærri fmv cutscene með hljóði, leyfum að kalla þetta upprunalega 100% kóðann, með því að kóða myndbandið / hljóðið aftur til lægri bitahraða segðu 80% þú sparar strax 20% af stærð skráar ... gæði er vart áberandi, (sumir rippers lækka jafnvel ... 50% en flestir fara úr sannri hd (1080) í HD (720) eða þessa dagana úr 4k í 2k eða 1080 ... þú ' ert að fá leikinn frítt svo hver kvartar raunverulega? svo vídeókóðun getur sparað mikið pláss á cutscene þungum leikjum en hvað um í leikjum / í vélaleikjum? eins og GTA V? ja ég veit ekki hvernig þeim tókst að endurpakka svona leikir. Ef tölvan þín er að dæla hljóðinu þínu í gegnum hljómtæki frá þriðja aðila eða magnara + hátalara 128-320kbit mp3 hljómar fínt ... fyrir leik að minnsta kosti .. svo aftur spararðu meira pláss frá hljóðinu.

Pakkameðferð:

ef þú hefur einhvern tíma farið að skoða leikina þína settu upp skrár þá hefurðu eflaust séð pak skrár eða bin eða í grundvallaratriðum stórar multi GB skrár sem eru merktar "hljóð" eða "tal" þetta er hvernig game devs pakka skránum sínum .. í staðinn fyrir með möppu með hundruðum mp3s fyrir talskrár þá pakka þeir þeim öllum saman í eina skrá ... þegar tungumálaskrár eru fjarlægðar verður hljóðritari að pakka niður þessum skrám til að fá aðgang að einstökum skrám, vinna með þær og pakka þeim svo aftur í stakri skrá þessa er þannig að þeir geta fjarlægt skrárnar sem hægt er að fjarlægja, umrita í dulmáli þær sem þarf að skreppa saman til að spara pláss eða flatt út í staðinn fyrir tómar skrár sem bera sama nafn en engin gögn svo þeir starfa sem staðhafi í skránni .

Og það mikilvægasta ... Hærri þjöppunartæki. við vitum öll hvað zip / rar / 7z osfrv eru, það eru aðferðir til að þjappa skrám í skjalasöfn sem eru minni en óþjappaðar útgáfur, frá upphafi þjöppunar hafa verið gerðar endurbætur og aðferðir sem gera betri vinnu en á kostnað einhverra annarra auðlind.

Lang saga stutt, þessa dagana eru þjöppunarverkfæri svo góð að það þarf mjög lítið að fjarlægja úr upprunalega leiknum ..

og þeir rífa meira að segja allan multiplayer mode .. sem nú til dags er það eina sem leikur devs nenna jafnvel að eyða tíma í ... horfinn eru fps leikir eins spilarans með herferðum sem keyra 10-20 tíma +. Devs notaðu bara einn spilara / offline spilara sem viðbót við aðalviðburðinn „multiplayer“ vegna þess að við getum horfst í augu við það, sjóræningjastarfsemi getur enn ekki áreiðanlega sprungið multiplayer stillingar, þú þarft samt að borga fyrir að spila .. server authentication, opinber leikkerfi eins og steam / uppruna sem athuga / meðhöndla lögmæti leiksins þíns og tengja aðra til að spila á netinu ...


svara 2:

Frábær leið til að útskýra þetta er með líkingu.

Ímyndaðu þér að í stað þess að hafa stutt orð til að tákna flóknar skilgreiningar, þá urðum við öll að nota flóknar skilgreiningar. Þjöppun tekur flóknar hugmyndir og þjappar þeim saman í smærri orð.

Sem dæmi skulum við gera einhverja raunverulega þjöppun.

Segðu að ég eigi setningu til vinar:

„Ég hef mikla ósk um að allir myndu hefja viðskipti sem ekki eru umdeild viðskipti og viðskipti á stóra berginu sem við erum nú á.“

Það er ansi orðheppin setning til að tákna þá hugmynd að ég vilji heimsfrið, en vinur minn getur aðeins skilið þessi orð en ekki þau flóknari sem við notum oftar. Við getum ein og sér ekki gert þessa setningu miklu styttri nema að hafa vitneskju um fleiri orð en þau sem gefin eru upp. Við getum búið til styttri setningu ef við búum til orðabók með stuttum orðum til að tákna lengri setningarnar!

Orðabók: Bobble: Ég hef mikla þörf. Hlífðargleraugu: Allir menn Frithy: Að æfa viðskipti sem ekki eru umdeild Hobot: Viðskiptaviðskipti Jörðin: Stóri kletturinn sem við erum nú á

Ný setning [með því að nota orðabókina] „Bubbla um að hlífðargleraugu myndu byrja freyðandi og hobot á jörðinni.“

Setningin er örugglega styttri! Þegar vinurinn vill meina setninguna getur hann einfaldlega skipt út orðunum í orðabókinni sem birtast í setningunni með samsvarandi skilgreiningu og engar upplýsingar tapast við skiptinguna!

Því miður, þetta gerir í raun ekki gögnin til að senda eitthvað minni, bara þá einu setningu. Þetta er vegna þess að við verðum að senda orðabókina AUKA við nýju setninguna. Þetta útilokar ávinninginn af nýju setningunni og EYKIR í raun stærð heildargagna sem send eru.

Svo þú gætir verið að velta fyrir þér hver tilgangurinn er með líkingunni; þegar öllu er á botninn hvolft, jukum við bara stærð gagnanna en þjappuðum þeim ekki saman.

Jæja, þessi orðabókarskiptin nálgun virkar ekki fyrir mynstralausa strengi gagnanna. Segðu í staðinn, ég hef eitthvað svona til að senda vini mínum:

"stóra klettinn sem við erum nú á. Stóri kletturinn sem við lifum núna á. stóri kletturinn sem við lifum núna á. stóri kletturinn sem við lifum á. Fjórtán. stóri kletturinn sem við erum núna lifandi á. stóra berginu sem við erum nú á. stóru berginu sem við erum nú á. stóra berginu sem við erum nú á. Fjólublátt. "

Þessi setning hefur sömu setningu endurtekin átta sinnum: eitthvað sem orðabókaskipti geta hjálpað okkur með!

Orðabók: E: "stóri kletturinn sem við erum nú á."

Ný setning [með orðabókinni] "EEEEFourteen. EEEEPurple"

Það er ótrúlegur stærðarmunur, jafnvel þegar þú tekur orðabókina með!

Þetta er svipað og þjöppun virkar í tölvum: þjöppunarforritið skoðar gögnin fyrir algenga endurtekna hluti, býr til færslu í orðabók fyrir það og kemur síðan í stað hverrar uppákomu endurtekins hlutar með orðinu í orðabókinni sem samsvarar mynstrinu. Þetta er kjarninn í taplausri þjöppun. Það eru nokkrar aðrar tegundir þjöppunar sem sérhæfa sig í öðrum verkefnum, en þessi er almenna gagnaþjöppunin.

Munurinn á því hvernig ákveðin forrit þjappa skrám er eingöngu útfærsluatriði. Þeir keppa með því að reyna að finna skjótasta eða árangursríkasta leiðina til að finna mynstur og búa til orðabókarfærslur. Sum forrit segja að það sé þeirra leið en annað að það sé önnur leið. Sá sem er bestur til notkunar ræðst oft af því hvaða skrá er að þjappa.


svara 3:

Ein einfaldasta aðferðin við þjöppun er

Kóðun hlaupalengdar

(RLE).

Segjum að þú hafir mynd með látlausan bláan bakgrunn. Í hverri röð pixla í stað þess að geyma „bláan, bláan, bláan, ... bláan osfrv“ 1000 sinnum gætirðu einfaldlega geymt „1000, bláan“ og sparað mikið pláss. Við afkóðun myndarinnar les algríminn það bara og segir: "ó, það þarf blátt þúsund sinnum. Ekkert mál."

Fyrir línur með öðrum litum gæti það litið út eins og: „36, blár, 73, rauður, 42, magenta, 5, grænn, 86, grár ...“ Þetta er samt betra en að geyma hverja einustu pixla. Þannig að með því að gera þetta minnkar þú magn bætanna sem þarf til að geyma upplýsingarnar fyrir myndina. Auðvitað eru litir geymdir með tölum, ekki orðum, en þú færð hugmyndina.

Þetta er dæmi um taplausa þjöppun. Þetta er vegna þess að þú getur dregið út nákvæma mynd í afkóðunarferlinu. Það er, þú tapar engum upplýsingum. Þetta á ekki bara við um myndir heldur er hægt að nota til að þjappa hvaða skrá sem er).

Það er líka taplaus þjöppun, þar sem hægt er að henda upplýsingum og vera samt viðunandi. Hugsaðu um mynd af skýjum. Skiptu myndinni í örsmáa 8x8 kubba og þú munt komast að því að hægt er að nálgast sumar þeirra með halla og hægt er að geyma þær einfaldlega í tveimur litum og stefnu. Raunveruleg mynd er ekki hægt að endurbyggja nákvæmlega en niðurstaðan er ásættanleg fyrir mannsaugað svo að minnkun gagnastærðar er þess virði.

Tónlist er einnig hægt að þjappa með taplausri þjöppun og vera samt viðunandi fyrir eyrað. En aðrar tegundir gagna hafa ekki efni á að tapa einum bita af upplýsingum. Tölvuforrit þarf að smíða nákvæmlega ella keyrir forritið undarlegar skipanir og leiðir til kerfishruns.

Þjöppun er mikilvæg vegna þess að hún tekur ekki aðeins minna pláss í minni og á diski, heldur er hún mun fljótlegri að flytja yfir samskiptaleiðir. Til dæmis, því meira sem myndir, hljóð og önnur gögn eru þjappað, því hraðar mun vefsíða hlaðast.


svara 4:

Það er engin reiknirit á bak við þjöppun skrár. Í staðinn nota þjöppunaralgóritmar safn heuristics sem vitað er að virka vel í reynd. Til dæmis:

  • Huffman kóðun skoðar tíðni stafa / stuttra strengja og þjappar inntakinu með því að úthluta tíðari hlutum styttri kóða.
  • Kóðun á hlaupalengd skoðar efni sem endurtekur sig mörgum sinnum í röð og kóðar það sem „endurtaka xy sinnum“
  • Lempel – Ziv – Welch og svipaðar þjöppunarreiknirit byggja upp orðabók yfir strengi sem þeir hafa þegar séð í innsláttinum og endurnýta þá þegar sumir strengir endurtaka sig. Þjappaða skráin mun innihalda leiðbeiningar eins og „líttu 120 stafi til baka og afritaðu 5 stafi þaðan“.
  • Burrows – Wheeler umbreyting er „töfrandi“ afturkræf strengja umbreyting notuð í bzip2. Umbreytta strengnum er venjulega hægt að þjappa betur saman vegna þess að efni sem birtist í svipuðu samhengi áður en umbreytingin er samfelld á eftir. (Ef það var ekki skynsamlegt, ekki hika við að samþykkja að það töfra.)
  • Sumar þjöppunarreiknirit nota „metaheuristics“ :) Til dæmis, þegar þjappað er mynd af Portable Network Graphics (PNG), göngum við fyrst í gegnum myndina pixla fyrir pixla og reynum að spá fyrir um gildi hennar frá þeim pixlum sem áður hafa sést. Í stað þess að þjappa raunverulegu pixlum þjappum við saman villum spár okkar (þ.e. með því hversu mikið var spáð af). Því betri sem spár okkar eru, því nær verða villurnar öllum núllum, því auðveldara er að þjappa þeim saman.
  • Enn aðrar þjöppunarreiknirit eru tapsár: með því að þjappa skránni töpum við upplýsingum. Nánar tiltekið höfum við jafnvægi milli stærðar þjappaðrar skjals og gæða niðurstöðunnar. Til dæmis, í hljóðformi eins og MP3 sniði erum við í grundvallaratriðum að reyna að nálgast upprunalegu bylgjufallið með safni einfaldra reglubundinna aðgerða (td. Sinus). Því meira af þeim sem við notum, því nákvæmara getum við áætlað frumritið, en því meira diskapláss sem við þurfum. Það eru svipuð upplausn þegar þjappað er saman myndum (td JPEG) og myndbandi (td MPEG-4 og mörgum öðrum undanfarin ár).

Athugaðu að lokum að við getum ekki gert betur en þetta. Nákvæm (taplaus) þjöppun mun alltaf líta svona út: það verður alltaf safn af járnsög sem virka sómasamlega vegna þess að upprunalega leiðin okkar til að geyma upplýsingar var óþarfi á fyrirsjáanlegan hátt. Jafnvel þó að við getum skilgreint

ákjósanlegasta leiðin til að þjappa skrá

(þ.e. þess

Kolmogorov flækjustig

), getum við einnig sannað að slík þjöppun er ekki hægt að reikna út með algrím.


svara 5:

Flest þjöppunarforrit nota afbrigði af

LZ aðlögunarorðabók byggð reiknirit

að skreppa saman skrár. „LZ“ vísar til

Lempel og Ziv

, höfundar reikniritsins og "orðabók" vísar til aðferðar við

skráningu

stykki af gögnum. Á flestum tungumálum heims birtast ákveðnir stafir og orð oft saman í sama mynstri. Vegna þessa mikla óþarfa,

textaskrár

þjappa mjög vel saman. Lækkun um 50 prósent eða meira er dæmigert fyrir textaskrá í stórri stærð. Flestir

forritunarmál

eru líka mjög óþarfir vegna þess að þeir nota tiltölulega lítið safn skipana sem fara oft saman í settu mynstri. Skrár sem innihalda mikið af einstökum upplýsingum, svo sem grafík eða

MP3 skrár

, er ekki hægt að þjappa mikið saman við þetta kerfi vegna þess að þau endurtaka ekki mörg mynstur (meira um þetta í næsta kafla). Ef skrá hefur mörg endurtekin mynstur eykst hlutfall lækkunar venjulega með skráarstærð. Einnig gætu meira útbreidd mynstur komið fram í lengri vinnu, sem gerir okkur kleift að búa til skilvirkari orðabók.

Þessi skilvirkni veltur einnig á hinu sérstaka

reiknirit

notað af þjöppunarforritinu. Sum forrit eru sérstaklega til þess fallin að taka upp mynstur í ákveðnum tegundum skráa og geta því þjappað þeim nákvæmar. Aðrir hafa orðabækur innan orðabóka, sem gætu þjappast saman á skilvirkan hátt fyrir stærri skrár en ekki fyrir minni. Þó að öll þjöppunarforrit af þessu tagi vinni með sömu grunnhugmyndina, þá er í raun töluverður breytileiki í framkvæmdinni. Forritarar eru alltaf að reyna að byggja upp betra kerfi.


svara 6:

Fyrir skrár þar sem taplausa þjöppun er krafist er algeng tækni eitthvað eins og Lempel-Ziv-Welch (LZW) reikniritið, sem leitar að endurteknum stafröðum í skránni og kemur í staðinn fyrir mun styttri bitaröð. Á sama tíma er orðabók smíðuð yfir það hvaða stutta bitamynstur samsvarar hvaða lengri röð. Þetta ferli endurtekur í gegnum skrána og byggir aðlögunarhæfni mest bjartsýna röð styttra raða sem það getur, svo að hægt sé að snúa ferlinu við til að endurgera upphaflegu gögnin á nákvæmri mynd. Þjöppunarstigið er í beinum tengslum við hversu margar endurteknar raðir geta fundist og hversu langar þær eru. Ákveðnar tegundir skjala lána sér því betur fyrir taplausri þjöppun en aðrar.

Fyrir skrár þar sem tapsamþjöppun er leyfileg, svo sem ljósmyndir, tónlist og myndband, eru mismunandi reiknirit notuð sem taka líkön af skynjun manna með í reikninginn, þannig að endurgerðu gögnin eru ekki stærðfræðilega nákvæm afrit af frumritinu. Hins vegar er tap á sumum upprunalegum gögnum, með góðri reiknirit, sanngjörn útgáfa af upprunalegu þannig að endurbyggingin sem myndast er ennþá metin ásættanleg af notanda. Þetta er vegna þess að reikniritið vinnur að því að fjarlægja aðeins gögn sem stuðla að minna áberandi þáttum gagnanna (til dæmis, hljóðlátari tíðnisvið í hljóði eru skynjuð með hærri og meira áberandi.) Í slíkum reikniritum er yfirleitt hægt að bæta gæði endurbyggingar með því að versla meiri gæði fyrir lægra gagnatap (og því minni virkni þjöppunar). Samt sem áður er „viðurkenning“ eðlislæg huglægur mælikvarði og sumum finnst niðurstöður tapaðra reiknirita vera ámælisverðar í tiltekinni hámarks leyfilegri stærð / bitahraða þeirrar skráar sem myndast, þar sem aðrir geta orðið var við lítinn sem engan mun á sömu stillingum.


svara 7:

Ég get svarað þessari spurningu vel :) Ég hef sjálfur gert endurpakkanir ... svo ég geti útskýrt eitthvað fyrir þér.

Endurpakka teymi á internetinu hafa sitt sérstaka verkfæri til að þjappa skrám af tilteknum leik. Þeir nota mismunandi reiknirit til að þjappa og minnka skráarstærðir. Það eru tonn af litlum verkfærum fyrir mismunandi leikjavélar. Það eru nokkur spjallborð á internetinu þar sem þú getur fundið slík verkfæri.

Þessi verkfæri eru hönnuð í samræmi við straumana sem eru til staðar í tilteknum leik tiltekinnar leikjavélar.

Ég mun ræða eina af algengu aðferðunum sem þeir nota, ég kalla hana „Forþjöppun“. Það felur í sér greiningu á straumum og afturþjöppun þeirra og síðan þjappað aftur með sterkari reiknirit.

Sjálfgefið er að leikjaskrár í flestum leikjunum séu nú þegar þjappaðar að hámarki með zlib eða DEFLATE aðferð. Svo, verkfæri eins og WinRAR eða WinZIP geta einfaldlega ekki verið notuð til að þjappa þegar þjappuðum skrám. Svo þeir þjappa þessum zlib straumum niður, (óþjappað framleiðsla er augljóslega stærri), þá er sterkari þjöppunaraðferð eins og LZMA notuð í þessum óþjappuðu lækjum til að minnka skráarstærð verulega. Þannig að betri þjöppunarhlutföll fást.

Í stuttu máli erum við að nota LZMA í stað zlib eða DEFLATE.

Og þeir umrita aftur vídeóin í 50% bitahraða til að draga úr skráarstærð og halda gæðum eins. Sama er gert fyrir hljóðskrárnar.

FYI sum þessara tækja sem þau nota eru PRECOMP, SREP & FreeArc

Takk fyrir.


svara 8:

Þeir eru mjög snjallt fólk. "The Scenes" sem eru oft kölluð Pirate Groups til dæmis Blackbox, Kaos Krew, RG Mechanix o.fl. nota mismunandi aðferðir til að þjappa leikjum án mikils gæðataps.

Aðferðirnar sem notaðar eru til að þjappa er svipaðar aðferðinni við þjöppun sem ZIP, 7Zip eða WinRAR nota. Það er með því að bera kennsl á endurtekna kóða og skipta þeim út fyrir einstök auðkenni heimilisfangs. En sviðsmyndirnar stoppa ekki þar.

Dæmigerð útgáfa fylgir NFO skrá. Það hefur framlengingu á .nfo og er hægt að opna það í Notepad. Í þeirri NFO skrá fylgir lýsingin á því hvernig þeim tókst að þjappa leikinn.

Algengustu aðferðirnar til þjöppunar eru: 1. Fjarlægðu of litla og / eða of háa upplausnar áferðapakka. Áferð sem við sjáum þegar við erum að spila er yfirleitt gerð fyrir hverja ályktun aðskilin. Að fjarlægja hærri upplausnina sparar þeim mikið pláss.

2. Tapað mynd- / hljóðþjöppun. Lækkun bitahraða hljóðs sem aðeins er hægt að bera kennsl á ef þú ert með hágæða hljóðkerfi eða ert hljóðfíll. Dregur úr upplausn skurðatriða. Að draga úr upplausn eykur afköstin verulega sem og tekur minna pláss þar sem kerfið þarf að reikna minna magn af pixlum.

3. Fjarlæging annarra tungumála en ensku. Þetta fjarlægir ekki aðeins texta skrár og valmyndar UI strengi heldur einnig stóra hljóðskrár. Mundu þá tíma þegar leikjadiskar komu með möguleika á að lesa hljóðskrárnar af geisladisknum sjálfum meðan á uppsetningu stóð. Hljóð notað til að gera mestan hluta af uppsetningarrýminu.

Athugasemd ef ég hef misst af einhverju, ég er viss um að ég hef gert það. Fyrirvari: Ef þér líkar við leikinn, vinsamlegast kaupðu hann og styðjið verktakana.


svara 9:

Þeir nota ýmsar þjöppunartækni.

Ég skal gefa þér dæmi um einfalda tækni. Það er kallað huffman hámarksafbrigðatækni.

Hér, Þú lest fyrst skrána og finnur síðan líkurnar á að hvert tákn komi fyrir í þeirri skrá..og skrifar það í lækkandi röð. Þannig að táknið sem helst er að finna í skránni verður efst. [Hér, tákn A]

Sameinaðu að minnsta kosti tvær líkur og búðu til nýtt tímabundið tákn. [Hér, að sameina D og E gerir tákn E '(ekki sýnt á mynd, tímabundið tákn er bara þér til hægðarauka)]

Gerðu það þangað til það eru aðeins tvö tákn.

Nú, svona lítur tréð þitt út.

A '

A B ''

B 'C' BCDE

Úthlutaðu að hlið greinarinnar verði 0 og hægri hlið gangsins 1.

Nú,

Nafnorð A = 0. Lýsingarorð B = 100 Lýsingarorð C = 101 Lýsingarorð D = 110 Lýsingarorð E = 111.

Ef við skulum gera ráð fyrir að skráin þín hafi verið AAAABCDE. Hér kemur tákn A mest fyrir.

Fyrir þjöppun sendir þú 8 bita fyrir hvert tákn. Svo það verða 64 bitar.

Eftir þjöppun sendir þú 0 0 0 0 100 101 110 111. Það eru aðeins 20 bitar.

Það eru aðrar aðferðir sem þú getur notað eins og LZ77, LZSS eða LZ78 nálgun.


svara 10:

Segjum að þú viljir pakka fötunum þínum í töskuna. Í fyrstu tilraun reynir þú að troða öllum fötunum þínum í töskuna og sjá að sum föt eru útundan. Svo kemur einn af vinum þínum og brýtur saman öll fötin, nú passa fleiri föt í töskuna. Þriðji vinur lítur á töskuna þína og segir að hann hafi betri leið til að raða fötum í töskuna þína en hinn vinurinn. Þegar þú reynir það sérðu að nú passa fleiri föt í töskuna en áður.

Gagnaþjöppun er mjög svipuð ofangreindri atburðarás. Það snýst um að brjóta saman betur eða tákna gögnin þín þannig að fleiri gögn passi inn í tiltekið rými eða tiltekið gagnamagn taki mun minna pláss en krafist er.

Hugleiddu einfalda reiknirit eins og, RLE eða Run Length Encoding. Við skulum gera ráð fyrir að upphafleg gögn séu

AAAAABBBBBCCCCC

Nú vinnur RLE með því að skipta um staf af runu fyrir stafinn og lengd þess. Svo núna þegar við beitum þessu fáum við

A5B5C5

Sem er miklu minni en orginal strengurinn. Að sama skapi eru nokkrar reiknirit eins og reiknikóðun, Lempel-Ziv osfrv. Sem tákna gögnin á betri hátt og draga þannig úr stærð upphaflegra gagna. Almennt hugbúnaður eins og winzip notar sambland af einni eða fleiri slíkum reikniritum til að þjappa gögnum


svara 11:

Tökum upphaf 1. Mósebókar sem dæmi. Hér eru fyrstu fimm setningarnar:

Í upphafi skapaði Guð himin og jörð. Og jörðin var formlaus og tóm; og myrkur var á djúpinu. Og andi Guðs færðist yfir vatnið, og Guð sagði: Það skal vera ljós og það var ljós. Og Guð sá ljósið, að það var gott, og Guð skildi ljósið frá myrkrinu.

Hvernig gátum við þjappað þessum kafla saman? Hér er hugmynd; tökum þau orð sem oftast koma og skiptum þeim út fyrir tíðnaröð þeirra. Svo við fáum þessar skipti eða vísitölu:

: 1 og: 2 Guð: 3 var: 4 ljós: 5 af: 6 jörð: 7 myrkur: 8 á: 9.

með leiðinni sem myndast:

Í 1 byrjun 2 skapaði 1 himinn 2 1 7. 2 1 7 4 án forms, 2 ógilt; 2 8 4 9 1 andlit 6 1 djúpt. 2 1 Andi 6 3 hreyfður 9 1 andlit 6 1 vötn.2 3 sögðu, Látum vera 5 2 þar 4 5. 2 3 sá 1 5, að það 4 gott: 2 3 skipt 1 5 frá 1 8.

Þú sérð að þetta styttist verulega. Bættu því við vísitöluna hér að ofan og bingó, þú hefur þjappað skránni saman. Viðbótarvísitalan gerir kleift að endurbyggja upprunalega leið.

Svo til að þjappa okkur, finnum við langa endurtekna hluti af upprunalegu skránni og skiptum þeim út fyrir stutta skiptitengi. Við bætum vísitölunni við svo hægt sé að endurgera frumtextann.

Eftir því sem skrár verða stærri verður vísitalan tiltölulega minni og hagnaðurinn af skiptunum stærri. Reiknirit vinna út smáatriðin um bestu strengina sem þeir geta komið í staðinn og ákjósanlegar afleysingar þeirra.