Вчені представили новий інструмент для ідентифікації рослин

19.03.2022, Служба новин ІАС "Аграрії разом"
Вчені представили новий інструмент для ідентифікації рослин Рис.1
Фото: із відкритих джерел

Викопні рослини показують еволюцію зеленого життя на Землі, але найчисленніші знайдені зразки — викопне листя — також найважче ідентифікувати. Велика бібліотека візуальних листів з відкритим доступом, розроблена командою під керівництвом Пенсільванського університету, надає новий ресурс, який допомагає вченим розпізнавати та класифікувати ці листки.

"Складність листя зашкалює, і термінологія, яку ми використовуємо для їх опису, - це лише найменший початок того, що необхідно", - сказав Пітер Вілф, професор геолого-геофізичних досліджень у Пенсільванському університеті. «Дослідникам потрібні набагато доступніші візуальні орієнтири для вивчення різниці між багатьма групами рослин, щоб ми могли висловити це словами. Є багато родин рослин, які зовні схожі, і ця колекція дає можливість побачити нові візерунки».

from-museum-to-laptop.jpg

Вибрані пари сучасного та викопного листя з нового великого набору даних, створеного групою вчених зі штату Пенсільванія.

Вивчення копалин та сучасного листя традиційно вимагає дослідницьких відвідувань музейних колекцій, що потребує фінансування, планування та часу для поїздок у кілька місць. Все більше музеїв розміщують колекції листя в Інтернеті, але часто ці зображення мають низьку роздільну здатність, важкодоступні у великій кількості, мають неінформативні імена файлів або листи сфотографовані з іншими частинами рослин та етикетками, що ускладнює швидке порівняння, кажуть вчені.

Вчені об'єднали зображення сучасного та викопного листя з кількох відомих колекцій, у тому числі кількох, які раніше не були доступні в Інтернеті в будь-якому форматі, і витратили тисячі годин на форматування даних, щоб створити єдиний об'єднаний набір даних з відкритим доступом зі стандартизованими, легкодоступними іменами файлів та високої точністю зображення з роздільною здатністю. Вони повідомили у PhytoKeys, що набір даних доступний у репозиторії Figshare Plus.

Набір даних містить 30 252 зображення, у тому числі 26 176 зображень розчищених і просвічених рентгенівським випромінюванням листя та 4 076 копалин листя. Очищене листя є зразками, які були хімічно відбілені, пофарбовані і поміщені на предметні стекла, щоб виявити візерунки жилок. Кожне зображення є ваучерним музейним експонатом.

"Що ми зробили тут, так це зробили цей величезний освітній ресурс доступним для всіх, перевіривши та стандартизувавши всі ці зображення з різних застарілих джерел", - сказав Вілф. «Нам усім знадобилося 15 років, щоб зробити це та перетворити всі імена файлів, але тепер ви можете отримати весь пакет на своєму робочому столі одним клацанням миші у браузері. У кожне ім'я файлу вбудована ключова інформація, так само для швидкої альфа-версії. сортування: сімейство, рід, вид і номер екземпляра.Імена файлів можуть бути швидко знайдені в лічені секунди для цікавого для вас елемента і зображення переглядаються за допомогою стандартних інструментів, таких як рядок пошуку Windows.Усі зображення мають оригінальну роздільну здатність, нічого не зниженої дискретизації».

Набір даних є потенційним ресурсом як для навчання студентів, але й програм машинного навчання. Подача перевірених навчальних даних у навчальні алгоритми дозволяє їм краще ідентифікувати листя і знаходити важливі візуальні закономірності, які люди могли згаяти або не змогли побачити.

"Для вчених, які вивчають ботанічні предмети, особливо такі області, як палеоботаніка, ці інструменти можуть найбільш надійно використовуватися для полегшення та збільшення впливу людського досвіду", - сказав Джейкоб Роуз, докторант Університету Брауна, який тісно співпрацював з Вілфом для створення дослідження. 

Його радник Томас Серр, професор комп'ютерних наук у Браунівському університеті, також зробив свій внесок.

«Використання цих моделей як відправна точка для прийняття, відхилення або подальшого вивчення експертом незабаром може виявитися переконливим прикладом використання технології для збільшення цінності, яку може зробити один учений, а також того, що можливо для нас як суспільству, щоб дізнатися про світ природи, як у масштабі, і у точності».

Машинне навчання може бути особливо важливим для палеоботаників, які найчастіше знаходять ізольовані копалини листя без насіння, плодів або квітів, які могли б допомогти ідентифікувати рослини. Ще більше ускладнює проблему те, що багато окремих скам'янілостей є вимерлими рослинами.

Новий набір даних є багатообіцяючим варіантом для навчання машинному навчанню, оскільки він містить приклади сучасного та викопного листя, перевірених, принаймні, на рівні сімейства, вищої таксономічної класифікації, яка є стандартною першою метою для ідентифікації викопного листя. Сімейство Fagaceae, наприклад, включає буки, каштани та дуби.

Набір даних включає зображення з вкладів Джека А. Вулфа та Лео Дж. Хіки до Національної колекції очищеного листя та колекції рентгенівських знімків Скотта Уінга у Смітсонівському національному музеї національної історії, Вашингтон, округ Колумбія, та колекцію Деніела І. Аксельрода. Колекція листя в Музеї палеонтології Університету Каліфорнії в Берклі. Також включені зображення скам'янілостей із різних місць у Північній та Південній Америці. Найбільший внесок робить Національний монумент Florissant Fossil Beds в Колорадо.

"Ця база даних робить інформацію з цих колекцій доступною для людей у ​​всьому світі у формі, яку легше шукати, ніж оригінал, і яка більш піддається цифровому аналізу", - сказав Скотт Вінг, геолог-дослідник та куратор палеоботаніки у Смітсонівському інституті. «Ми думаємо, що база даних стимулюватиме нові дослідження, а також відкриє музейні колекції для людей».

Також читайте:

Джерело: 
phys.org.
Читайте більше новин з розділів: 
Наука, інновації Наука (Ексклюзив) Усі новини
Дізнавайтесь першими найсвіжіші агрономічні новини України та світу на нашій сторінці в Facebook, Twitter Telegram.

Коментарі та відгуки