2.6.1. Зміст і можливості використання нейронних мереж при

Головна

Банківська справа / Бізнес-планування . Економіка підприємства. / Бухгалтерський облік. Аудит / Інвестиції / Податки та оподаткування / Фінансовий менеджмент / Економіка

Головна →

Фінанси →

Банківська справа →

« Попередня		Наступна »

О.І. Лаврушин, О.Н. Афанасьєва, С.Л. Корнієнко. БАНКІВСЬКА СПРАВА: СУЧАСНА СИСТЕМА КРЕДИТУВАННЯ., 2007 - перейти до змісту підручника
2.6.1. Зміст і можливості використання нейронних мереж при оцінці кредитоспроможності позичальника
Перші спроби штучно відтворити функції біологічних нейронів були зроблені в 40-ті роки XX в. Успіхи, досягнуті в 50-60-ті роки при моделюванні рішення задач розпізнавання образів за допомогою найпростіших НС - одношарових персептронов, стимулювали спроби використовувати їх в самих різноманітних практичних додатках. Однак на рубежі 70-х років XX в. стало ясно, що одношарові персептрони не в змозі відтворити рішення деяких найпростіших завдань. Внаслідок цього до середини 80-х років в основному йшло теоретичне вивчення штучних НС. Новий і набагато більш потужний сплеск практичного інтересу до НС, спостерігається останніми роками, пов'язаний з розробкою алгоритмів створення і навчання багатошарових НС, а також з появою елементної бази, що дозволяє конструювати апаратні моделі таких мереж. Досить тривалий час основною областю додатків НС був військово-промисловий комплекс. Однак широкі можливості вирішення банківських і фінансових завдань привели до того, що ряд великих розробників НС зайнявся створенням систем, націлених на вирішення виключно банківських проблем. Стосовно до банківської сфері можна виділити такі основні групи завдань, що вирішуються за допомогою НС: прогнозування часових рядів (курсів акцій, валютних курсів і т.д.); аналіз і виявлення аномалій в поведінці об'єкта (виявлення зловживань у сфері пластикових карт); розпізнавання підпису клієнта; класифікація позичальників залежно від значення кредитного ризику. Ми вже говорили, що основним показником кредитоспроможності позичальника є його кредитний рейтинг. Процес присвоєння кредитного рейтингу полягає в переході від групи показників, в основному фінансових, до єдиного інтегрованого значенням - рейтингу. Інструментом такого переходу в більшості випадків служить рівняння лінійної залежності. При цьому ваги показників, що беруть участь у розрахунку рейтингу, встановлюються банками на суб'єктивній основі. Така практика, як зазначалось, спотворює результати аналізу і надзвичайно ризикована. Саме незадоволеність можливостями традиційних методів статистики і непогані результати, отримані в даній області за допомогою НС, позво-ляють зробити висновок про появу нового інструменту оцінки кредитоспроможності позичальника. Деякі вважають, що ми переживаємо період переходу від порівняно слабкого використання наукових методів у банківській сфері до такого стану справ, коли наукові методи будуть визначати сам характер банківської справи. При цьому ключова роль відводиться використанню НС. У 1993 р. в Європі для вивчення можливостей застосування НС при оцінці кредитного ризику була створена організація «Equifax Europe New Technology Club». Аналіз існуючих програмних продуктів з НС показав, що деякі з них дозволяють домогтися набагато вищих результатів, ніж у випадку застосування традиційних методів аналізу. У російській банківській практиці НС майже не використовуються, а світовий досвід зосереджений в області оцінки кредитного ризику по позичальникам - фізичним особам. Ідея НС народилася в ході досліджень в галузі штучного інтелекту, а саме в результаті спроб відтворити здатність біологічних нервових систем навчатися і виправляти помилки, моделюючи структуру людського мозку. Мозок складається з дуже великого числа нейронів, з'єднаних численними зв'язками. Нейрони - спеціальні клітини, здатні поширювати електрохімічні сигнали. Нейрон має розгалужену структуру введення інформації (ден-ДРІТ), ядро і розгалужується вихід (аксон) (рис. 2.4). Аксони клітини з'єднуються з дендритами інших клітин за допомогою синапсів. При активації нейрон посилає електрохімічний сигнал за своїм аксону. Через синапси цей сигнал досягає інших нейронів, які можуть в свою чергу активуватися. Нейрон активується тоді, коли сумарний рівень сигналів, що прийшли в його ядро здендрітов, перевищить певний рівень (поріг активації). Інтенсивність сигналу, одержуваного нейроном, і, отже, можливість його активації залежать від активності синапсів. Таким чином, будучи побудований з дуже великого числа простих елементів (кожен з яких бере зважену суму вхідних сигналів і в разі якщо сумарний вхід перевищує певний рівень, передає сигнал далі), мозок здатний вирішувати надзвичайно складні завдання . Алгоритм роботи штучних НС практично копіює сутність біологічних нейронних систем. Штучний нейрон отримує сигнали через кілька вхідних каналів. Кожен вхідний сигнал проходить через з'єднання (синапс), що має певну інтенсивність (вага). Поточний стан нейрона визначається як зважена сума його входів: Сукупність нейронів, з'єднаних таким чином, що вихідний сигнал одного нейрона служить вхідною інформацією іншого нейрона, являє собою багатошарову НС. Як правило, НС використовується тоді, коли між відомими вхідними значеннями і невідомими виходами існує зв'язок, але не відомий точний тип зв'язку. Особливість НС полягає в тому, що залежність між входом і виходом знаходиться в процесі навчання мережі. Для навчання НС застосовують алгоритми двох типів: кероване (навчання з учителем) і некероване (навчання без учителя). Для керованого навчання мережі потрібно підготувати набір навчальних даних. Ці дані представляють собою набори вхідних даних і відповідних їм виходів. НС навчається встановлювати зв'язок між першими і другими. Зазвичай навчальні дані беруться з історичних відомостей. Як інструмент навчання може бути використаний один з декількох алгоритмів. Якщо мережа навчена добре, вона набуває здатність моделювати невідому функцію, що зв'язує значення вхідних і вихідних змінних, і згодом така НС використовується для прогнозування ситуації, коли вихідні значення не відомі. Завдання навчання полягає в емпіричному знаходженні нелінійних залежності між вихідними показниками і результатом, тобто знаходженні такого типу функції у =? (5), яка максимально точно відображала б взаємозв'язок розглянутих показників. Мінлива 5 в даному випадку являє собою значення нейрона, яке, як показано раніше, визначається добутком величини входу X (вихідні показники навчання) і ваги нейрона т. Іншими словами, в процесі навчання аналізується рівняння У = де X, - і У - змінні, значення яких відомі, а значення підлягають визначенню. Навчання НС відбувається за допомогою так званих спостережень. У процесі першого спостереження НС, володіючи здатністю виявляти залежності, самостійно встановлює початкові значення'ох. Ці значення підставляються у формулу ^ ЕХуа;,), і отримана в результаті функція визначає величину результуючого показника У. Розрахована величина У порівнюється з реальною величиною показника виходу з навчального набору даних, і обчислюється відхилення між цими показниками. Якщо відхилення велике, то проводиться ще одне аналогічне спостереження, тобто спочатку коректування ваги тю, потім розрахунок функції ^ ЕХ, ^,), потім визначення нового значення У і його порівняння з реальним показником. Спостереження повторюються до тих пір, поки помилка розрахунку У не стане близька до нуля. Вважається, що в міру проведення спостережень НС все ближче і ближче наближається до знаходження потрібного типу зв'язку. Стосовно до аналізу кредитоспроможності позичальника навчання НС відбувається наступним чином: є сукупність під-приємств з уже присвоєними кредитними рейтингами. Цим рейтингам відповідають значення кількісних і якісних показників, що містяться у кредитному досьє. У процесі спостережень НС обчислює вага кожного показника, що враховується при розрахунку кредитного рейтингу. Отримані значення ваг коригуються до тих пір, поки що розраховуються за допомогою цих ваг кредитні рейтинги всієї вихідної сукупності позичальників не співпадуть із заданими значеннями. У цьому випадку помилка навчання буде зведена до нуля, а НС відтворить точний тип зв'язку між показниками діяльності позичальника та його кредитним рейтингом. Процес рішення задачі за допомогою НС починається зі збору даних для навчання. Навчальний набір даних являє собою вже відому інформацію, для якої вказані значення входять і виходять змінних. Вибір змінних, принаймні первісною, може здійснюватися інтуїтивно. На першому етапі розглядається вся сукупність змінних, які здатні впливати на результат. Потім це безліч скорочується. Раніше ми показали, що оцінка кредитоспроможності проводиться на основі всебічного аналізу діяльності позичальника. Це, наприклад, і розрахунок фінансових коефіцієнтів, і визначення величини грошового потоку, і облік галузевих особливостей діяльності, макроекономічного стану в країні. Сукупність такої інформації про діяльність позичальника і являє собою набір входять змінних. Такому набору даних відповідають вже розраховані значення кредитних рейтингів, тобто виходять змінні. НС працюють з числовими даними без обмежень. Більш важким завданням є робота з даними нечислового характеру. Найчастіше нечислові дані бувають представлені у вигляді номінальних змінних типу Пол = (Чоловічий, Жіночий). У такому випадку номінальні змінні перетворюються в числову форму. Це дозволяє НС враховувати фактори, які не піддаються опису іншими статистичними методами. Питання про те, які дані взяти в якості вхідних для НС, - один з найскладніших. Це пояснюється кількома причинами. По-перше, при вирішенні реальних завдань часто невідомо, як прогнозований показник пов'язаний з наявними даними. Тому збираються різноманітні дані у великих обсягах; серед цих даних імовірно є і важливі, і такі, цінність яких не відома і сумнівна. По-друге, в задачах нелінійної природи серед параметрів можуть бути взаємозалежні і надлишкові. Наприклад, кожен з двох параметрів може сам по собі нічого не означати, але разом вони несуть надзвичайно важливу інформацію. Тому спроби ранжувати параметри за ступенем значущості можуть виявитися неправильними. І нарешті, іноді краще просто прибрати деякі змінні, в тому числі несучі значиму інформацію, щоб зменшити число вхідних змінних, а значить, і складність завдання, і розміри мережі. Проблема значного ускладнення розрахунків за рахунок незначного збільшення числа входять змінних отримала назву «прокляття розмірності». Єдиний спосіб отримати гарантію того, що вхідні дані обрані найкращим чином, - перепробувати всі можливі варіанти вхідних наборів і вибрати найкращий. На практиці зробити це неможливо через величезної кількості варіантів. Одне з дієвих засобів вирішення питання - генетичний алгоритм відбору вхідних даних. Цей алгоритм виконує велике число експериментів з різними комбінаціями вхідних даних, будує для кожної з них імовірнісну мережу, оцінює її результати і використовує їх в подальшому пошуку найкращого варіанта. Оскільки процес розуміння роботи генетичного алгоритму дуже важливий, звернемося до еволюційної теорії природного відбору, що служить початковою точкою відліку в даному питанні. Суть природного відбору полягає в тому, що найбільш пристосовані особини краще виживають, ніж менш пристосовані, причому ознаки і властивості наступного покоління успадковуються від попереднього. Основний носій спадкової інформації - хромосома, що складається з певного числа генів. Кожен окремий ген відповідає за певну властивість. Процес появи нових хромосом носить назву «кросовер». При кросовері нитки хромосом розриваються в декількох випадкових місцях і потім обмінюються частинами. Таким чином змінюється склад генів, що входять в хромосому. Другий важливий фактор, що впливає на спадковість, - мутації, які виражаються у зміні деяких ділянок хромосом. Мутації також випадкові і можуть бути викликані різними факторами. Отже, природний відбір гарантує, що найбільш пристосовані особини дадуть досить велике потомство, а завдяки генетичному спадкоємства частина цього потомства не тільки збереже високу пристосованість батьків, а й буде володіти деякими новими властивостями. Якщо ці нові властивості виявляться корисними, то з великою ймовірністю вони перейдуть і в наступне покоління. Таким чином відбуваються накопичення корисних якостей і поступове підвищення пристосовності біологічного виду в цілому. Знаючи, як вирішується завдання оптимізації видів у природі, можна застосувати даний метод при вирішенні реальних завдань. Раніше було показано, що нейронні мережі вивчають функцію Х2, Хп), де XI - сукупність вхідних параметрів явища. У генетичному алгоритмі хромосома - це сукупність параметрів одного спостереження, тобто деякий числовий вектор, а набір хромосом визначає рішення задачі. Які саме вектори варто розглядати при вирішенні конкретної задачі, визначає користувач. Далі робота генетичного алгоритму полягає в тому, що за допомогою операцій кросовера і мутації модифікуються параметри, складові вектор спостереження. У простому випадку кросовер в генетичному алгоритмі реалізується так само, як в біології. Як ми говорили, хромосоми розриваються у випадковій точці і обмінюються частинами. Так, якщо хромосоми (а, Ь, с, (1, е) і (0, 0, 0, 0, 0) розрізати між третім і четвертим генами і обміняти їх частини, то вийде наступне покоління: (я, Ь} з , 0, 0) і (0, 0, 0, (1, е). У генетичному алгоритмі зберігається основний принцип природного відбору: чим інформативніше значення вектора (хромосоми), тим з більшою ймовірністю він буде брати участь в кросовері. Мутація вектора полягає в випадковій зміні одного з його показників. Потім стара популяція частково або повністю знищується і розглядається наступне покоління. Популяція наступного покоління містить стільки ж хромосом, але в силу відбору їх інформативність стає вище. У кожному новому поколінні спостерігається виникнення зовсім нових рішень поставленого завдання і число « хороших »рішень буде зростати. Питання про те, скільки спостережень потрібно мати для достовірного навчання мережі, часто виявляється непростим. Відомий ряд правил, що погоджує число необхідних спостережень з розмірами мережі. Найпростіше правило говорить, що число спостережень має бути в 10 разів більше числа зв'язків у мережі. Насправді це число залежить також від складності відображення, яке НС прагне відтворити. Із зростанням кількості змінних кількість необхідних спостережень зростає нелінійно, так що вже при досить невеликому числі змінних, наприклад 50, може знадобитися величезне число спостережень. Для більшої частини реальних завдань, як правило, досить кілька сотень спостережень. Якщо є менший набір даних, то отриманої інформації буде недостатньо для правильного навчання мережі. У будь-якому випадку кількість спостережень визначається для кожної НС індивідуально на основі величини помилки розрахованого і заданого виходить показника. Велике значення для ефективного використання НС має вибір архітектури мережі. Багатошарова НС (багатошаровий персеп-трон), описана на початку параграфа, використовується найбільш часто. Кожен елемент такої мережі будує зважену суму своїх входів, потім пропускає цю величину активації через передавальну функцію, і таким чином виходить вихідне значення цього елемента. Елементи організовані пошарово з прямою передачею сигналу. Таку мережу легко інтерпретувати як модель «вхід - вихід», в якій вільними параметрами є ваги і порогові значення. Мережа подібної структури може моделювати функцію практично будь-якого ступеня складності, причому число шарів і число елементів в кожному шарі визначають складність функції. Після того як визначено число шарів та елементів НС, потрібно знайти значення для ваг і порогів мережі, які б мінімізували помилку прогнозу, що видається мережею. Саме для цієї мети служать алгоритми навчання. За допомогою зібраних історичних даних ваги і порогові значення автоматично коригуються з метою мінімізувати помилку. У спрощеному вигляді цей процес являє собою підгонку моделі НС до наявних навчальних даних. Помилка для конкретної конфігурації мережі визначається шляхом прогону через мережу всіх наявних спостережень і порівняння реально видаються вихідних значень з цільовими. Такі різниці підсумовуються в функцію помилки, значення якої і є помилка мережі. Найчастіше для побудови функції помилки всі помилки вихідних елементів для всіх спостережень зводяться в квадрат і потім сумуються. Найвідоміший спосіб навчання НС - алгоритм зворотного поширення. По завершенні процесу навчання мережі можна зробити висновок про те, що НС встановила існуючі залежності між змінними. Тоді на вхід мережі подаються дані спостереження, сутність якого потрібно оцінити. У задачі класифікації мережу відносить кожне нове спостереження до одного з декількох класів. Високі результати роботи НС пояснюються наступними властивостями нейромережі: здатністю до повної обробки інформації. Велика частина відомих завдань вирішується за допомогою НС. Це досягається за рахунок асоціативності мережі, здатності до класифікації, узагальнення та абстрагування; самоорганізацією. У процесі роботи НС самостійно або під впливом зовнішнього середовища навчається вирішення різноманітних завдань. Нейромережа формує алгоритм своєї діяльності, уточнюючи і ускладнюючи його протягом часу; обучаемостью. У процесі навчання НС виявляє нелінійні залежності між змінними, і на основі такого знання будує свій прогноз; \| Паралельністю обробки інформації. Кожен нейрон формує свій вихід тільки на основі своїх входів і власного внутрішнього стану під впливом деякої функції активації. Таким чином, теоретичні розробки в області нейронних мереж показали можливість використання НС в якості надійного і дієвого інструменту аналізу та прогнозування соціально-економічних явищ, у тому числі в сфері розрахунку кредитних ризиків індивідуальних позичальників - фізичних осіб. Як вже було показано, процес аналізу кредитоспроможності позичальника, іншими словами, привласнення кредитного рейтингу, полягає в переході від декількох показників до інтегрованого значенням - кредитному рейтингу. Протягом останніх 50 років в літературі з даної тематики, а також у банківській практиці склалося стійке уявлення про існування лінійної залежності між кредитним рейтингом і показниками, що характеризують діяльність позичальника. Такий стан призводить до того, що методики, використовувані комерційними банками при оцінці кредитоспроможності позичальника, суб'єктивні, не відображають достовірно і повною мірою економічне становище аналізованого підприємства. Гіпотези про нелінійної залежності показників довгий час не могли бути розглянуті на практиці у зв'язку з відсутністю необхідного інструментарію. Поява нейронних мереж дозволяє відкрити нові перспективи в цій галузі. У цьому параграфі йдеться про можливість використання механізму НС для ефективної оцінки кредитоспроможності позичальника. При визначенні кредитного рейтингу підприємства скористаємося багатошарової нейронної мережею. На етапі навчання на вхід НС будемо подавати інформацію, що характеризує економічну діяльність позичальника. Така інформація може бути заснована на вже існуючих кредитних досьє комерційного банку. В якості виходить інформації, необхідної для навчання НС, використовуються вже розраховані на підставі вхідних показників кредитні рейтинги. У процесі навчання НС виявляє нелінійні залежності між показниками і рейтингом. Навчання НС відбувається за методом зворотного поширення помилки. Мета навчання полягає в мінімізації помилок при визначенні кредитних рейтингів заданої сукупності підприємств. Навчання йде до тих пір, поки ваги показників, а отже, і функція зв'язку показники - рейтинг не «навчиться правильно» класифікувати підприємства, тобто поки розраховані НС рейтинги не будуть збігатися з заданими. Після завершення навчання на вхід НС будемо подавати інформацію ана-логічного формату, по якій необхідно визначити значення кре-дітно рейтингу. Свої розрахунки ми робимо з використанням комп'ютерної програми «STATISTICA Neural Networks». Алгоритм роботи НС, як уже зазначалося, складається з двох етапів: навчання НС на підставі вже наявної сукупності показників і привласнених кредитних рейтингів; використання навченої НС з знайденої функцією залежності «показники - кредитний рейтинг» для рейтингової оцінки майбутніх позичальників.
« Попередня		Наступна »
= Перейти до змісту підручника =

© 2015-2022 econ.awardspace.biz