Как работать с базой аукционных торгов AI? Корреляции и регрессии
Практическое руководство по использованию главного интеллектуального актива нашего ресурса
В предыдущем материале мы рассказали о сути парных групп как одного из методов сравнительного анализа, а также показали наглядный пример построения парной группы на основе сопоставления площади работ. В этой части мы продолжим разбор парных групп, расширив диапазон анализа другими характеристиками предметов искусства, а также предложим читателю методику определения диапазона стоимости работы с учетом полученных знаний.
Для начала напомним, что художником, выбранным для примера, является Георгий Нисский (1903–1987) — официально самый дорогой представитель «сурового стиля», а заодно и всего направления соцреализма. Индустриальный пейзаж «Над снегами (другое название — «Над заснеженными полями»), 1964, был продан на лондонском Sotheby’s в 2014 году за $2,9 млн. Продажа произошла на волне тотального интереса рынка (и российского, и западного) к соцреализму: Королевская академия искусств в Лондоне объявила о подготовке масштабной ретроспективы советских художников к столетию Октябрьской революции, а в Москве активизировались бизнесмены-коллекционеры Андрей Филатов (фонд Art Russe), Алексей Ананьев (Музей русского реалистического искусства) и функционер Максут Фаткулин (организатор Международной конфедерации союзов художников, по факту — правопреемника имущественных прав на работы в собрании Союза художников СССР). Именно их усилия сделали возможным выведение на торги и громкие приобретения работ Нисского и ряда других авторов-соцреалистов.
Сегодня, глядя на фамилии основных сил, лоббировавших в середине 2010-х массовый интерес рынка к творчеству соцреалистов, мы, к сожалению, отметим, что большинство персоналий ушли не только из мира искусства, но покинули информационное поле — порой с крупными скандалами. Поэтому, ставя задачу проанализировать продажи работ Георгия Нисского для выявления принципов их ценообразования, грамотный коллекционер для начала соберет воедино самые крупные сделки с произведениями художника — чтобы заранее удостовериться в отсутствии резких ценовых колебаний.
Вот что у нас получилось в случае топ-20 продаж автора:
Разница между 1 и 10 местами составляет пропорцию 1:48, между 1 и 20 местами — 1:227. Без преувеличения, это чудовищные значения, буквально кричащие о необоснованных перепадах в настроении рынка (либо обоснованных с точки зрения спекуляции — чему прямых подтверждений мы не имеем; в 2014 году коллекционеры были готовы покупать соцреализм по таким ценам, учитывая уровень маркетинговой и институциональной поддержки). Однако пропорция между 3 и 10, а также 10 и 20 местами уже составляет 1:5 — совершенно здоровый показатель. Другими словами, без двух самых крупных продаж рынок произведений Нисского — достойный, доступный и привлекательный.
Возвращаемся к парным группам. Исследователь арт-рынка имеет дело с многочисленными переменными (площадью, годом создания, категорией, страной проведения торгов и т. д.), поэтому важнейшим действием на первом этапе будет определить влияние каждой из них на итоговую цену продажи. Для этого можно использовать два сравнительно простых метода: корреляционного и регрессионного анализа, доступных в Microsoft Excel даже новичку. Эти методы позволяют измерить силу связи между переменными и результатами — например, между площадью и ценой или между категорией и ценой. И если окажется, что страна продажи работы исторически (статистически) оказывала более серьезное влияние на итоговую цену, чем площадь работы, то коллекционер будет внимательнее выбирать продавца.
Традиционно немного объясним читателю подходы каждого из анализов:
1) Корреляционный анализ (только для числовых переменных):
• помогает определить степень зависимости между двумя переменными (например, площадью и ценой продажи);
• итоговым значением будет «коэффициент корреляции» — варьирующийся от –1 (полная отрицательная зависимость) до 1 (полная положительная зависимость);
• формула для расчета корреляции в Excel: =CORREL(диапазон_переменной_1, диапазон_переменной_2), где диапазон переменных — выделенные пользователем значения в любой из анализируемых колонок.
2) Регрессионный анализ (для числовых и категориальных переменных):
• позволяет оценить «вклад» каждой переменной в итоговый результат;
• результатом регрессионного анализа будет коэффициент для каждой переменной, который покажет ее «вклад» в изменение зависимой переменной (в нашем случае — цены продажи). Чем выше коэффициент — тем больше влияние;
• для проведения регрессионного анализа в Excel требуется перейди во вкладку Data Analysis (Анализ данных) и выбрать Regression (Регрессия). Если этой опции нет, нужно активировать «Пакет анализа»;
• далее пользователь выделяет диапазон зависимой переменной (цену продажи) и диапазон независимых переменных (площадь, год создания или категорию).
Важное примечание: поскольку корреляционный анализ оперирует сопоставлением двух числовых значений, то проанализировать зависимость итоговой цены от категориальных переменных (категория, жанр или страна проведения торгов), записанных буквами, он не сможет. Поэтому исследователю перед проведением работы необходимо сначала присвоить всем категориальным значениям числовые аналоги — а затем (главное!) не запутаться в них при расшифровке.
Для обоих вариантов анализа нами использовались следующие переменные:
• год создания;
• категория;
• жанр;
• площадь, кв. мм;
• средний эстимейт;
• дата торгов;
• аукционный дом;
• город.
Вот что у нас получилось:
1) Корреляционный анализ (только для числовых переменных):
• средний эстимейт имеет сильную положительную корреляцию с суммой продажи (0,89);
• площадь работы также имеет значительную корреляцию с суммой продажи (0,63);
• год создания показывает умеренную положительную корреляцию с суммой продажи (0,20);
• другие переменные, такие как категория, жанр, аукционный дом и город, имеют менее значимую корреляцию с суммой продажи.
2) Регрессионный анализ (для числовых и категориальных переменных):
• средний эстимейт имеет самый значимый положительный вклад (коэффициент 2,42) в сумму продажи, что соответствует результатам корреляционного анализа;
• категория, жанр и площадь также оказывают положительное влияние;
• год создания имеет отрицательный коэффициент, что указывает на небольшое отрицательное влияние на итоговую сумму продажи.
Получив подобный результат, начинающий коллекционер спросит себя (а заодно и нас): почему в случае корреляционного анализа величина зависимости от года создания — положительная, а влияния года создания в случае регрессионного анализа — отрицательная? Нет ли в расчетах ошибки?
Скажем сразу: ошибки нет, но вопрос очень уместный. Корреляция указывает на направление и силу связи двух переменных в изоляции, а регрессия — на влияние каждой переменной с учетом всех остальных факторов. Различия между результатами этих анализов могут возникать по двум причинам:
1) Различия в подходах. Корреляция показывает взаимосвязь между двумя переменными, без учета других факторов. Например, в случае «года создания» и «суммы продажи», корреляция с коэффициентом 0,20 означает, что между этими двумя переменными есть умеренная положительная связь, если рассматривать их в изоляции от других факторов. Другими словами, если бы в аукционном каталоге упоминался лишь год создания, он оказывал бы небольшое положительное воздействие на итоговый результат.
Регрессионный анализ рассматривает влияние каждой переменной, учитывая влияние всех остальных факторов. Коэффициент для «года создания» (со значением –854,24) указывает на то, что при наличии других переменных (категория, жанр, средний эстимейт и т. д.), увеличение года создания приводит к уменьшению суммы продажи. Иначе говоря, когда в аукционном каталоге стоят и другие переменные (в нашем случае — категория, площадь и эстимейт), их влияние оказывается более значимым.
2) Конфликт определенных переменных между собой. Для трактовки подобных несоответствий при проверке результатов анализа используются специальные методы. Ими и воспользуемся.
И что же мы видим? «Конфликт интересов» найден: в случае Георгия Нисского друг другу «мешают» год создания и средний эстимейт! Объясним проще: у нашего художника есть самый значимый, установленный рынком (в абсолютных цифрах продаж) период: 1960-е годы, когда максимально раскрылся минималистичный «суровый стиль» Нисского. Понимая это, аукционные дома немного увеличивают эстимейт данных работ (предварительно собрав информацию аналогичную нашей: эстимейт у Георгия Нисского положительно влияет на итоговые продажи). Коллекционеры отвечают в умеренно-положительном ключе: работы приобретаются, и средний эстимейт в данных сделках превышен в среднем на 69 %. Однако, когда на торги выводятся более ранние работы художника (1920–50-е годы), ввиду их массовости и более низкого рыночного спроса, оцениваются они аукционными домами заведомо чуть ниже рынка — в итоге средний эстимейт при успешных сделках превышен «лишь» на 12 %. Таким образом, мы установили, что для работ Георгия Нисского 1) год создания оказывает влияние на цену продажи и 2) что влияние это отрицательное.
3) Отсутствие в расчетах по-настоящему значимых переменных. Крайне интересный пункт, который способен многое объяснить — а порой и поставить все полученные результаты с ног на голову. Например, в своем анализе (опирающемся на данные базы AI) мы не учитывали маркетинговые факторы — параллельное наличие (или отсутствие) выставок художника, массив и объем публикаций, количество упоминаний в СМИ и социальных сетях и т. д. Если использовать данную переменную (назовем ее «маркетинговый ход») в нашей работе, мы увидим корреляцию наиболее успешных продаж художника с PR-активностью со значением близким к единице. Ровно то же получится, если мы добавим в качестве переменной… сюжетный элемент, а именно — самолет (после самой крупной продажи художника существенно взвинтивший цены на все работы Нисского с авиатематикой).
Итак, мы научились определять влияние доступных в базе AI факторов-переменных на итоговый результат продажи. Самое время переходить к практической части: предложить читателю оценить потенциальную стоимость работы авторства Георгия Нисского, включая вероятность продажи, на основе полученных знаний. Правда, делать мы это будем уже в следующей части: Microsoft Word подсказывает, что мы пересекли рубеж в 10 тыс. знаков, отвечающий за читательское внимание и интерес.
А эти две переменные для нас важнее всего! Продолжим со свежими силами через пару дней.
Постоянный адрес статьи:
https://artinvestment.ru/invest/analytics/20241015_baza_ai_6.html
https://artinvestment.ru/en/invest/analytics/20241015_baza_ai_6.html
© artinvestment.ru, 2024
Внимание! Все материалы сайта и базы данных аукционных результатов ARTinvestment.RU, включая иллюстрированные справочные сведение о проданных на аукционах произведениях, предназначены для использования исключительно в информационных, научных, учебных и культурных целях в соответствии со ст. 1274 ГК РФ. Использование в коммерческих целях или с нарушением правил, установленных ГК РФ, не допускается. ARTinvestment.RU не отвечает за содержание материалов, представленных третьими лицами. В случае нарушения прав третьих лиц, администрация сайта оставляет за собой право удалить их с сайта и из базы данных на основании обращения уполномоченного органа.