خوشه‌بندی و پیش‌بینی سودآوری شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران با رویکرد درخت‌تصمیم C5

نوع مقاله: مقاله پژوهشی

نویسندگان

1 استادیار حسابداری دانشگاه تهران

2 کارشناس ارشد حسابداری، مدرس دانشگاه قم

چکیده

امروزه سرمایه‌گذاران با توجه به فضای ‌رقابتی حاکم باید محتاط‌تر از قبل تصمیم بگیرند. به این منظور آنها می‌توانند از بانک‌های اطلاعاتی بورس ‌اوراق‌ بهادار استفاده‌کنند. اما این اطلاعات به تنهایی مثمر‌ثمر نیست، بنابراین لازم است با ‌استفاده از فنون داده‌کاوی تجزیه، تحلیل و تفسیرداده‌ها انجام ‌شود تا اطلاعات قابل‌اتکاتری در اختیار استفاده‌کنندگان قرار‌گیرد. هدف این پژوهش خوشه‌بندی و پیش‌بینی سودآوری شرکت‌‌ها و تعیین عوامل موثر بر سودآوری شرکت‌های عضو بورس اوراق بهادار تهران است. جهت این کار، 888 شرکت-سال در محدوده زمانی 1395-1387 انتخاب شدند. پس‌از پیش‌پردازش اولیه داده‌ها، با نرم‌افزارهای متلب و Clementine و با استفاده از معیار SSE و روش K-Means شرکت‌ها به 3 خوشه‌ تبدیل شدند و نتایج این خوشه‌بندی‌ها بوسیله معیار سنجش کیفیت، مورد سنجش قرار گرفت. در ادامه با استفاده از درخت‌تصمیم C5 خوشه‌ها تحلیل و متغیرهای تاثیرگذار بر سودآوری، شناسایی شد. از32 متغیر تحلیل شده تنها 8 متغیر شامل: سودخالص به کل دارایی ، فروش به کل دارایی، سودخالص به حقوق صاحبان سهام، سود عملیاتی به فروش خالص، سود و زیان انباشته به حقوق صاحبان سهام، سودخالص به فروش خالص، کل بدهیها بهکل داراییها و دارایی‌های جاری به کل دارایی‌ها بر سودآوری شرکتها تاثیر میگذارند. در نهایت با درنظرگرفتن این متغیرها، پیش‌بینی سودآوری شرکت ها طبق هرخوشه انجام ‌شد که دقت پیش‌بینی خوشه‌ها به ترتیب 34/86 درصد، 15/88 درصد و 68/81 درصد است.

کلیدواژه‌ها


عنوان مقاله [English]

Clustering and Profitability Forecast of Companies listed in Tehran Stock Exchange with the Decision Tree c5 Approach

نویسندگان [English]

  • Mohammadreza Mehrabanpour 1
  • Malihe Habibzade 2
1 Assistant Professor of Accounting, University of Tehran
2 MSc. Accounting, Lecturer of Qom University
چکیده [English]

The intense competition prevailing in the world today and investors should be more cautious about their decision given the prevailing conditions. But this information alone is not useful, so it is necessary to use data mining techniques to analyze and interpret data so that more informative information will be available to users. Therefore, the purpose of this study is to cluster and forecast the profitability of companies. For this purpose, Tehran Stock Exchange companies were considered as the statistical population of the research and 888 companies in the period of 1387-1395 were selected as the research sample. So, in the beginning after the initial preprocessing of the data, with Matlab and Clementine software, using SSE criteria and K-Means method, the companies were converted to 3 clusters and the result of these clustering were measured by the standard quality measures. Finally, by using the C5 decision tree, cluster analysis and variables affecting profitability were identified; so that from the 32 considered variables only 8 includes: Gross profit to total assets, sales to total assets, profit to equity, operating profit to net sales, accrued profit and loss to equity, net profit to net sales, total liabilities to total assets and current assets to total assets affect the profitability of companies. At last, by taking these variables into account, prediction of each cluster was done, and the accuracy of the predictions sequence was 86,34%, 88,15% and 68.81%

کلیدواژه‌ها [English]

  • Forecasting
  • profitability
  • Clustering
  • Decision Trees C5
آشتاب، علی، رضازاده، جواد. (1389) رابطه دقت پیش‌بینی سود و بازده سهام شرکت های جدیدالورود به بورس اوراق بهادار تهران، پژوهشنامه علوم اقتصادی: 9، (1)، (پیاپی37).

اعتمادی، حسین. آذر، عادل. بقائی، وحید. (1391) به‌کارگیری شبکه‌های عصبی در پیش‌بینی‌ سودآوری شرکت‌ها. دانش حسابداری: 3، (10)، 70-51.

افسر، امیر. مهجوب، رحمت. مینایی، بهروز. (1393). خوشه‌بندی اعتباری مشتریان به‌منظور ارائه تسهیلات مالی به آن‌ها. مطالعه مدیریت ایران: 4، (17).

باقرزاده، ر. شهرابی، ج. لطیفی، م. (1387). بررسی تکنیک‌های داده‌کاوی برای ایجاد سیستم‌های اندازه لباس. دومین کنفرانس داده‌کاوی ایران.

بقائی، وحید. (1389). به‌کارگیری شبکه‌های عصبی برای پیش‌بینی سودآوری شرکت‌ها. پایان‌نامه کارشناسی ارشد حسابداری. دانشکده مدیریت و اقتصاد. دانشگاه تربیت مدرس.

بهرام فر، نقی. ساعی، محمدجواد. (1385). ارائه مدل برای پیش‌بینی‌ عملکرد (مالی و بازار) شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران با استفاده از اطلاعات مالی منتشره. بررسی‌های حسابداری و حسابرسی. (43)، 70-45.

جنت رستمی، م. (1378). بررسی نقش و قابلیت سود و جریان‌های نقدی آتی سرمایه‌گذاری در سهام شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. پایان‌نامه کارشناسی ارشد، دانشکده علوم اداری دانشگاه شهید بهشتی.

حسینی نسب، حجت. خدامی‌ پور، احمد. حیاتی، حسین. (1394). بررسی تأثیر خطای پیش‌بینی‌ سود دوره قبل بر واکنش بازار به پیش‌بینی‌ سود مدیریت و انواع مختلف مدیریت سود. دانش حسابداری: 6، (21): 83-108.

حقیقت، حمید. بختیاری، مسعود. بهشتی پور، محمدتقی. (1390). رتبه‌بندی عوامل مؤثر بر میزان دقت پیش‌بینی‌ سود شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران در زمان افزایش سرمایه. بررسی‌های حسابداری و حسابرسی: (18): 41-62.

خالقی مقدم، حمید. آزاد، محمد. (1383). محتوای اطلاعاتی پیش‌بینی‌ سود شرکت‌ها. فصلنامه مطالعات تجربی حسابداری مالی:2، 7، 54-33.

دهقان، ندا. زارع، آرزو. هادی زاده، محسن. پیوندی، پدرام. (1392). روش‌های خوشه‌بندی k-means به‌منظور گروه‌بندی بدن. هشتمین کنفرانس ملی مهندسی نساجی ایران.

رحمانی، علی. حیاتی، نهاله. (1395). تاثیردقت برآوردی پیش‌بینی سود مدیران بررانش پس از اعلان سود. مجله دانش حسابداری، 7 (34): 7-40.

فرج زاده دهکردی، حسن. (1386). کاربرد الگوریتم ژنتیک در مدل بندی پیش‌بینی ورشکستگی. پایان‌نامه کارشناسی ارشد حسابداری، دانشکده مدیریت و اقتصاد، دانشگاه تربیت مدرس.

کردستانی،غلامرضا. آشتاب، علی. (1389). بررسی رابطه بین خطای پیش بینی سود و بازده غیرعادی سهام شرکت های جدیدالورود به بورس اوراق بهادار تهران، مجله بررسیهای حسابداری و حسابرسی: 17، (2): 279955.

مدرس، احمد. عباس زاده، محمدرضا. (1387). بررسی تحلیلی توانایی پیش‌بینی‌ اجزای تعهدی و جریان‌های تعهدی و جریان‌های نقدی بر کیفیت سود پیش‌بینی‌شده. مجله دانش توسعه: 15، (24): 212-248.

مطیعیان، حمید. نعیمی، احمد. (1392). بهینه‌سازی مسیر ترافیک برای خدمات حمل‌ونقل شرکت، با استفاده از خوشه‌بندی و الگوریتم‌های ژنتیکی، مهندسی حمل‌ونقل: 3، (4).

مهرانی، ساسان. مهرانی، کاوه. کرمی، غلامرضا. (1383). استفاده از اطلاعات تاریخی مالی و غیرمالی جهت تفکیک شرکت‌های موفق و ناموفق. بررسی‌های حسابداری و حسابرسی: 11، (38): 77-92.

مهربان‌پور، محمدرضا. نادری نورعینی، محمدمهدی. اینالو، عفت. اشعری، الهام. (1396). عوامل موثر بر سودآوری بانک‌ها. فصلنامه مطالعات تجربی حسابداری مالی: 14، (54): 113-134.

نمازی، محمد. شمس‌الدینی، کاظم. (1387). بررسی سازه‌های مؤثر بر دقت پیش‌بینی‌ سود توسط مدیریت شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. توسعه سرمایه: (1): 25-1.

Abraham, A. and Grosan, C. (2006) “Swarm intelligence in data mining”, Vol. 34 Ramos, springer. Search, pp. 342-352.

Acqaah, M., Chi, T. (2007). A Longitudinal Analysis of the impact of Firm Resources and IndustryCharacteristics on Firm-Specific profitability, Journal Management Governance , 11، 179-213.

Alpaydin, E. (2004) “introduction to machine learning”, MIT press.

Ashari, N., H. Chye Koh , S. L. Tan and W. H. Wong (1994) “Factors affecting income smoothing among listed companies in Singapore”, Accounting and Business Research.

Basu, S., (1983), The Relationship Between Earning Yield, Market Value, and Return for NYSE Common Stocks: Jornal of Financial Economics, No. 12, pp; 129-156.

Bernstein L. (1993). Financial Statement Analysis. 5thed. Homewood, IL: Irwin

Berry, M. J., Gordon, L. (2004). Data Mining Techniques for Marketing Sales and Customer Relationship Management. Journal of  Business Finance and Accounting, 18 (4)، 257-267.

Beynon, M., Clatworthy, M. and Jones, M. (2004). The prediction of profitability using accounting narratives: a variable-precision rough set approach. Intelligent Systems in Accounting, Finance and Management, Vol. 12 No. 4, PP 227-242.

Charitou, A.,  Clubb, C. (1999). Earnings, cash flows and security returns over long return intervals. Journal of Business Finance and Accounting, 26, 283–312.

Cho, S.,  Kim, J.,  Bae,  J. K. (2009). An integrative model with subject weight based on neural network learning for bankruptcy prediction. Expert Systems with Applications, 36, 403–410

Choi, J. H., Kalay, A., & Sadka, G. (2016). Earnings news, expected earnings, and aggregate stock returns. Journal of financial markets, 29, 110-143.

Finger, A. C., (1994), “The Ability of Earning to Predict Future Earnings and Cash flow”, Journal of Accounting Research, (Autumn), PP. 210-223.

Garrod, N., Rees, W. (1999). Forecasting Earnings Growth Using Fundamentals Woruag paper, University of Glasyow.

Graham, B., Dodd, D. and Cottle, L. (1962). Security Analysis, New York: Mc Graw Hill.

Gunn sr. (1998). support vector machines for classification and regression. ISIS technical report, 14.

hong, W. (2007). A recurrent support vector regression model in rainfall forecasting. Hydrological process, 21, 819-827.

‌Hong, Y. S. (‌2007). Capital growth ,‌financing source

Lam, D.,  Barber, K. (2004). Verifying and Explaining Agent Behavior in an Implemented Agent System.  in Third International Joint Conference on Autonomous Agents and Multiagent Systems, New York, 1226 – 1227

Lev, B. (1993). Fundamental Information Analysis, Journal of Accounting Research, 8, 190-215.

Machova, F., Barcak, P. (2006). A Bagging Method using Decision Trees in the Role of Base Classifiers. Journal of Acta Polytechnica Hungarica, 3, 126-132

Muramiya, K. & Takada, T. (2017). A Research Note: Quality of financial inputs and management earnings forecast accuracy in Japan, Journal of Contemporary Accounting and Economics, 13(2): 179-191.

Sharma, P. (2009). Advanced Application of Data Warehousing Using 3-tier Architecture. Journal of library & information technology, 29(2), 61-66

Sloan, R. (1996). Do stock Prices Fully Reflect Information in Accruals and Cash Flows about Future Earnings? Journal of  accounting Review, 71, 289-315

Vapnik, s. (1982). estimation of dependences based on empirical data.

Yang, Jing, (2010), “Causes and Solutions of Information Asymmetry in Stock Market”,www.seiofbluemountain.com

Ying Chan, C., Chun Lo, H. & Jing Yang, M. (2016). The revision frequency of earnings forecasts and firm characteristics. North American journal of economics and finance, 35: 116-132.