Древни свици се „читају“ машинским учењем да би се открио језик и дао им смисао

Недавно је објављена револуционарна најава за опоравак изгубљене античке књижевности. Користећи неинвазивну методу која користи машинско учење, међународни трио научника извукао је 15 колона старогрчког текста из карбонизованог папируса из Херкуланеума, приморског римског града осам километара југоисточно од Напуља у Италији.

Њихово постигнуће донело им је велику награду од 700.000 долара на Везувском изазову. Изазов је тежио да се подстакне технолошки развој позивањем јавности на учешће у истраживању.

Изазов Везува подстиче технолошки развој позивајући истраживаче да схвате како да „читају“ древне папирусе ископане из вулканског пепела Везува у Италији. Колоне грчког текста преузете из дела свитка. (Vesuvius Challenge), Author provided


Настао је из сарадње између компјутерског научника Брента Силса — који има дугогодишње интересовање за неинвазивне технологије за проучавање рукописа — и технолошких инвеститора Нета Фридмана и Данијела Гроса.

Иако је развој узбудљив, технологија је само део напретка учења. Рад на читању и анализи нових грчких и латинских текстова пронађених из папируса ће пасти на људска бића.

„Ерупција Везува“, Јохана Кристијана Дала (1824). (The Metropolitan Museum of Art), CC BY


Закопан у пепелу

Као и Помпеји, Херкуланум је затрпан катастрофалном ерупцијом Везува 79. н.е.

Велики део древног града остаје под земљом. Али 1752. године, ископавање је открило стотине свитака папируса у библиотеци једне сложене римске виле. Херкуланумски папируси су највећи преживели пример нетакнуте древне библиотеке сачуване у археолошким записима: библиотека је пронађена онаква каква је стварно постојала 79. н.е.

Тачан број књига је непознат, каже Мајкл Мекоскер, научни сарадник за папирологију на Универзитетском колеџу у Лондону, а различите методе процене дају различите резултате.

Карбонизовани папируси

Без кисеоника, интензивна топлота Везувовог пирокластичног тока је карбонисала (али није запалила) папирусе. На око налик на грудве угља, копачи из 18. века нису их одмах препознали као древне књиге.

Три неотворена папируса из Херкуланеума. (Bodleian Libraries/University of Oxford), CC BY-NC


Папируси су толико крхки да су многи уништени раним покушајима да приступе њиховим текстовима. Стога је њихово проучавање увек захтевало домишљатост. Године 1754. конзерватор и свештеник у Ватиканској библиотеци осмислили су машину за њихово лагано одмотавање.

Део размотаног херкуланеумског папируса.  (Bodleian Libraries/University of Oxford), CC BY-NC


У скорије време, мултиспектрална фотографија је драматично побољшала њихову читљивост. Али до сада је неинвазивна метода која би оставила свитке нетакнуте остала ван домашаја. Њен развој означава значајан напредак.

Мекоскер напомиње да се у каталогу налази 659 артикала који су наведени као „неодмотани“, али неки од њих су делови свитака.

Искрена иновација

Да би покренуо изазов, Силс је јавно објавио низ рендгенских снимака компјутеризоване томографије (ЦТ) високе резолуције од два свитка, као и сличних скенирања одвојених фрагмената са видљивим мастилом. Ово последње је од суштинског значаја као референтна тачка (или „контрола“) за иновативне приступе.

Дизајн такмичења је подстакао транспарентност и сарадњу: подаци објављени у потрази за мањим циљевима користили су свим конкурентима. Додатно, транспарентност је омогућила независну верификацију резултата. Тимови су се удружили око заједничких идеја и приступа проблему.

Текст помиње музику, укус, вид

Изазов је постао вест у октобру, када су прочитана прва слова: πορφυρας (именица или придев који укључује „љубичасто“).

До краја 2023. испуњени су критеријуми за доделу главне награде: четири пасуса од 140 карактера, са 85% пронађених слова. За победнике су проглашени докторанд који студира машинско учење, инжењер рачунарства и студент роботике.

Према Мекоскеру, текст који су обрадили помиње музику два пута, као и чула укуса и вида. Он мисли да је то вероватно дело о сензацији и доношењу одлука, у традицији филозофа Епикура (341–270 п.н.е.). Папиролошки тим изазова га још увек анализира.

Стотине ролни за проучавање

Ова година са собом доноси нове циљеве: након што је 2023. прочитано пет одсто једног свитка, изазов је поставио главни циљ за 2024. читање 90% од четири свитка. Са стотинама ролни које тек треба да се проуче, нови метод враћања садржаја Херкуланеум папируса тек почиње.

Али остаје неколико препрека. Производња скенирања у довољно високој резолуцији не може се обавити путем уобичајене опреме, али захтева приступ постројењу са акцелератором честица. Приступ правој опреми је ограничен и скуп. До данас су четири свитка и бројни одвојени фрагменти обрађени у објекту близу Оксфорда у Енглеској.

Већина неотворених свитака смештена је у Напуљу, а њихово безбедно достављање до неког објекта биће компликовано, као и резервисање и плаћање времена потребног за скенирање.

Друго ограничење је да је технологија за одмотавање и изравнавање папируса виртуелним средствима – процес који изазов назива „сегментација“ – спора и скупа. Помоћу тренутних техника, које укључују доста ручне манипулације, потпуно сегментирање једног свитка коштало би 1–5 милиона УСД. Сегментација треба да постане много ефикаснија како би се избегло уско грло.

Потребни су критични умови

Технологија је само део једначине. Од суштинског значаја за рад изазова је међународни тим папиролога. Њихова улога је да анализирају резултате модела читљивог старогрчког — и на тај начин утврде који су приступи најефикаснији.

Папирологија је узбудљив посао, али и изазован и мукотрпан. То захтева владање древним језицима и идејама, као и способност решавача загонетки да попуни неизбежне празнине. Папирологија је специјализована ниша: у ширем свету класика, папиролози су ретке птице. Број специјалиста Херкуланеума је још мањи.

Да би изазов заиста успео, биће нам потребни критични умови, као и технологија фиксирања. Потенцијално нам се открива доста нове античке филозофије, али она мора да се састави у кохерентан текст — слово по слово, реч по реч, реченицу по реченицу — пре него што се може шире проучавати. То ће захтевати научнике.


Мајкл Сампсон, ванредни професор класике, Универзитет Манитоба

ИЗВОР: https://theconversation.com/ancient-scrolls-are-being-read-by-machine-learning-with-human-knowledge-to-detect-language-and-make-sense-of-them-224334

0 $type={blogger}:

Постави коментар