![]() |
![]() |
![]() |
по Материалам XVIII Международной научной конференции диатомологов «Диатомовые водоросли: морфология, биология, систематика, экология, флористика, палеогеография, биостратиграфия», посвящённой памяти выдающихся российских диатомологов Н.И. Стрельниковой и Л.Я. Каган (28.08.2023 - 03.09.2023) Кластерный анализ некоторых форм створок диатомовых водорослей
Лях А.М. Anton M. Lyakh ФИЦ «Институт биологии южных морей имени А.О.Ковалевского РАН»
УДК 582.261.1+149:519.237.8
В работе представлены результаты применения кластерного анализа для выделения похожих форм створок диатомовых водорослей. Кластерный анализ использует числовые описания форм. Для получения таких описаний, контуры форм были преобразованы в последовательности нормированных и согласованных коэффициентов эллиптического преобразования Фурье. При помощи трех вариантов метода иерархической кластеризации по значениям коэффициентов были построенные дендрограммы, усеченные на уровне 6, 10 и 20 кластеров. Из полученных кластеров были выделены устойчивые группы форм, присутствующие во всех вариантах кластеризаций. Для каждой группы была построена средняя форма, которая считалась типовой. Типовые формы послужили образцом для классификации прочих форм створок диатомовых. Ключевые слова: диатомовые водоросли; форма створки; кластерный анализ; эллиптическое преобразование Фурье
Разнообразие форм створок диатомовых микроводорослей вызывает потребность в поиске адекватного способа систематизации сведений об этих формах. Обычно для этого формы объединяют в группы по степени схожести и выделяют в каждой группе характерные (типовые) формы. Эта задача и являлась целью настоящей работы. Для систематизации многочисленных сведений о формах организмов используют два классических подхода: качественный и количественный. Качественный подход субъективен. В этом случае для разграничения форм исследователи полагаются на собственные представления об отличительных признаках. Ими могут быть: форма общеизвестного объекта-аналога, на которую похожа наблюдаемая форма (форма груши, форма эллипса); выраженные особенности участка границы объекта (прямая, изогнутая, волнистая); узнаваемое строение характерной части объекта (острая, вытянутая, притупленная, закругленная). Значения качественных признаков описывают словом или словосочетаниями, которые становятся основой для названий конкретных форм. Для передачи нюансов строения, например пропорций, используют прилагательные или префиксы (Гололобова и др., 2022; Гогорев и др., 2023). Но из-за того, что одно и то же видимое геометрическое свойство можно выразить разным словами, возникает обилие плохо формализуемых описаний, которые создают серьезную путаницу. Терминологические словари, основная задача которых состоит в систематизации, унификации и уточнении многочисленных определений форм (Гололобова и др., 2022; Гогорев и др., 2023), по сути просто закрепляют некоторое название за выделенной исследователями характерной формой, но не дают четкого критерия отличия одной формы от другой. Потому что такой критерий нельзя сконструировать из качественных описаний. Спектр форм непрерывен. Между конкретными изображенными типовыми формами находится бесконечное число переходных вариантов, которые, с определенного момента, невозможно однозначно отнести к одному из выделенных типов, руководствуясь только словесными описаниями. Для этого нужны иные критерии. Поэтому качественный подход к выделению форм мало эффективен. Количественный подход объективнее качественного. В этом случае форму описывают наборами чисел, которые позволяют анализировать форму математическими методами. В том числе, они позволяют сравнивать формы и выделять группы похожих и отличающихся форм. От того насколько хорошо числа передают геометрические особенности формы, зависит точность последующего математического анализа. К примеру размеры не дают представления о целостной форме (особенно сложной), поэтому сравнение размеров не позволяет корректно выделить похожие формы. А к наиболее распространенным способам достаточно точного количественного описания формы относятся: – представление формы последовательностью координат точек (меток), расставленных по правилам в геометрически или биологически значимых местах; – описание границы формы бесконечной последовательностью кривых, которые при суммировании все больше и больше приближаются к исходной форме. Описание формы метками неоднократно подвергалось критике (Pappas et al., 2014). Поэтому в работе был использован второй подход, в котором граница формы створок была описана последовательностью эллипсов, характеристики которых служат дескрипторами формы. Такие характеристики называются коэффициентами эллиптического преобразования Фурье (Kuhl and Giardina, 1982; Crampton, 1995). Коэффициенты эллиптического преобразования Фурье (кЭПФ) широко используются для сравнения форм разнообразных объектов: от очертаний раковин двустворчатых моллюсков (Crampton, 1995) и форм створок диатомовых (Wishkerman and Hamilton, 2018), до форм озер на полюсе Титана (Dhingra et al., 2019). Это связано с тем, что коэффициенты позволяют точно описать границу любого плоского контура, они хорошо учитывают геометрию сложных форм и позволяют решить обратную задачу: восстановить контур по значениям коэффициентов. Классический метод расчета кЭПФ нормирует коэффициенты, то есть исключает влияние на значение коэффициентов поворота контура и положения его стартовой точки (Kuhl and Giardina, 1982; Crampton, 1995). Но при этом на значения нормированных коэффициентов влияет зеркальная симметрия и направление обхода контуров. Это значит, что симметричные контуры одинаковой формы и контуры с противоположным направлением обхода (по и против часовой стрелки) будут описаны разными наборами коэффициентов, что сделает невозможным корректное сравнение форм. Для исключения влияния на коэффициенты зеркальной симметрии и направления обхода нормированные коэффициенты были согласованы (Лях, 2019). Нормированные и согласованные коэффициенты вычислены в программе «Эль-Фурье» (Программа Эль-Фурье, 2023). Кластерный анализ использован для выделения по значениям коэффициентов групп похожих форм. Методы кластерного анализа объединяют объекты в группы (кластеры), используя в качестве меры расстояния между признаками объектов. Методы относятся к методам обучения без подсказок, то есть решении о принадлежности объекта к тому или иному кластеру метод принимает на основе значения расстояний. Таким образом кластерный анализ является объективным способом группировки форм. К настоящему времени описано несколько десятков алгоритмов кластеризации (Ezugwu et al., 2022; Henning, 2022). Из них биологам наиболее привычен метод агломеративной иерархической кластеризации, результатом которого является дендрограмма. Этот метод использован для кластеризации форм створок диатомовых по значениями коэффициентов. Метод дихотомически объединяет в кластеры все объекты. Итоговое число кластеров определяется значением порога, без которого оно совпадает с количеством объектов. В работе, для прослеживания динамики изменения состава кластеров, дендрограммы были разделены на 6, 10 и 20 кластеров. Всего было кластеризовано 66 форм створок диатомовых, взятых из работы Гогорева и др. (Гогорев и др., 2023). Разновидности метода иерархической кластеризации отличаются способами измерения расстояния между кластерами – мерой. Для кластеризации использовано три меры: полное расстояние (complete linkage), среднее расстояние (average linkage) и расстояние Варда (Wards). В результате получено три дендрограммы, с отличающимся составом кластеров. Среди полученных кластеров были выделены независящие от меры, устойчивые группы форм, которые присутствуют во всех вариантах кластеризаций. Считалось, что именно эти группы содержат типовые формы. Для каждой группы была построена средняя форма. Для этого были вычислены средние значения коэффициентов, составляющих каждую группу форм, и по ним, при помощи обратного эллиптического преобразования Фурье, были восстановлены средние формы. Средние формы считались типовыми. Они служили образцом для классификации прочих форм створок диатомовых, а также для выбора изображения диатомовых с похожими формами створок из Архипа – библиотеки опубликованных изображений одноклеточных водорослей (Архип, 2023).
Работа выполнена в рамках государственного задания ФИЦ ИнБЮМ «Закономерности формирования и антропогенная трансформация биоразнообразия и биоресурсов Азово-Черноморского бассейна и других районов Мирового океана» (гос. регистрационный № 121030100028-0). Автор заявляет об отсутствии конфликта интересов, требующего раскрытия в данном сообщении.
Список литературы
Статья поступила в редакцию 23.06.2023 Об авторах Лях Антон Михайлович – Anton M. Lyakh кандидат биологических наук me@antonlyakh.ru Корреспондентский адрес: Россия, 299011, г. Севастополь, пр-т Нахимова, 2, ИнБЮМ. Телефон: (8692)-55-07-95.
ССЫЛКА: Лях А.М. Кластерный анализ некоторых форм створок диатомовых водорослей // Вопросы современной альгологии. 2023. №2 (32). С. 185–188. URL: http://www.algology.ru/2086 DOI – https://doi.org/10.33624/2311-0147-2022-2(32)-185-188 EDN – XNNYHM При перепечатке ссылка на сайт обязательна
A cluster analysis of some shapes of diatom valves Anton M. Lyakh Kovalevsky Institute of Marine Biological Research RAS (Sevastopol, Russia)
The results of the application of a cluster analysis to the shapes of some diatom valves are presented in the paper. The cluster analysis uses numeric descriptors of the shapes. To get such descriptors, the outlines of shapes have been transformed to the sequences of normalized and coordinated coefficients of elliptic Fourier transform. The coefficients have been used to construct shape dendrograms with the help of thee variants of hierarchical cluster analysis. The dendrograms have been truncated at the level of 6, 10 and 20 clusters. From the obtained clusters the stable groups of shapes, that are presented in all variant of clustering, have been separated. For each shape group an average shape have been constructed, which has been considered as a type shape. The type shapes are used as a template for the classification of the other shapes of diatom valves. Key words: diatoms; valve shape; cluster analysis; elliptic Fourier transform
References
Author Lyakh Anton M. ORCID – https://orcid.org/0000-0001-7698-3961 Kovalevsky Institute of Marine Biological Research RAS, Sevastopol, Russia me@antonlyakh.ru
ARTICLE LINK: Lyakh A.M. A cluster analysis of some shapes of diatom valves. Voprosy sovremennoi algologii [Issues of modern algology]. 2023. №2 (32). P. 185–188. URL: http://www.algology.ru/2086 DOI – https://doi.org/10.33624/2311-0147-2022-2(32)-185-188 EDN – XNNYHM When reprinting a link to the site is required Dear colleagues! If you want to receive the version of the article in PDF format, write to the editor,please and we send it to you with pleasure for free.
На ГЛАВНУЮ
К разделу ОБЗОРЫ, СТАТЬИ И КРАТКИЕ СООБЩЕНИЯ![]() |
![]() |
|
![]() | ![]() | ||
|
|