ناشناس نگهداشتن دادههای کاربران، امنیت حریم خصوصی را تضمین نمیکند
گرچه تصویب قوانین GDPR گام بزرگی در جهت امنیت دادههای کاربران محسوب میشود، ولی کنترل ریسکهای نشت اطلاعات، هنوز به اقدامات وسیعتری نیاز دارد.
امروزه بازاریابی خوب، متکی به دادههای صحیح و دقیق مشتریان است و جای تعجب نیست که شرکتها روی جمعآوری اطلاعات مشتریان خود سرمایهگذاری میکنند. بهعنوانمثال آمازون دائماً رفتار ۱۰۰ میلیون عضو پرایم خود را بهعنوان «دادههای شخص اول» پیگیری میکند. بسیاری از شرکتها دریافتهاند که به اشتراک گذاشتن اطلاعات مشتریان با شرکتهای دیگر، بین آنها همکاری متقابلی برقرار میکند. مخصوصاً با افزایش دادههای اینترنت اشیا که از سنسورهای GPS، ابزارهای اندازهگیری هوشمند، دستگاههای فیتنس و نظیر آن به دست میآیند و دادههای «شخص دوم» نامیده میشوند. درنهایت نیز بسیاری از شرکتها دادههای شخص ثالث را از شرکتهایی نظیر Acxiom خریداری میکنند، که در هرلحظه تا ۱۵۰۰ داده را از ۷۰۰ میلیون مشتری در سراسر دنیا جمعآوری میکند.
هرچند اطلاعاتی که از این پایگاههای داده به دست میآید، پتانسیل بازاریابی مؤثر را بسیار بالا میبرد، اما درعینحال نگرانیهای مربوط با حفظ حریم شخصی کاربران، هیچ زمان تا به این حد جدی نبوده است. هکهای گسترده و شایعی که نمونهی آن را در رسوایی فیسبوک – آنالیتیکا شاهد بودیم، باعث شده مشتریان تمایلی برای به اشتراک گذاشتن دادههای خود نداشته باشند و حتی به برندهای مشهور هم اعتماد نکنند. طبیعتاً شرکتها بزرگترین بازندهی این میدان هستند. بهعنوانمثال هک سه میلیارد حساب کاربری یاهو باعث شد ورایزن قیمت پیشنهادی خرید این شرکت را تا ۳۵۰ میلیون دلار پایین بیاورد.
همانطور که مطالعات نشان میدهد، مصرفکنندگان متمایلند اطلاعات خود را در اختیار شرکتی قرار دهند که اطمینان دارند از این اطلاعات محافظت میکند. این روزها مقررات بیشتری برای پاسخگو نگهداشتن شرکتها وضعشده و کاربران میتوانند اطلاعات خود را ویرایش، حذف یا منتقل کنند و همچنین یک نسخه از تمامی دادههای خود را در اختیار داشته باشند. بهترین مثال فعلی نیز مقررات حفاظت از اطلاعات عمومی (GDPR) است که از ۲۵ ماه می در اتحادیه اروپا به مرحلهی اجرا درآمد و آمریکا نیز با دقت روندهای آن را زیر نظر گرفته است.
حالا سؤال تریلیون دلاری این است که آیا کسبوکارها، میتوانند همزمان با حفظ حریم خصوصی دادههای مشتریان، از مزایای بازاریابی مبتنی بر داده بهرهمند شوند؟
رویکردهای فعلی برای حفاظت از دادهها
در حال حاضر رایجترین رویکرد محافظتی کسبوکارها، محدود کردن دسترسی به دادههای جمعآوریشده است. البته کنترل دسترسی، به دلایل متعددی یک رویکرد کاملاً اطمینانبخش محسوب نمیشود. زیرا بهمحض اینکه یک شرکت دادهها را (چه به صورت داخلی و چه خارجی) به اشتراک میگذارد، قدرت کنترل دسترسی را تا حد زیادی از دست میدهد. بهعلاوه اقداماتی نظیر متخلص سازی یا Pseudonymization که یکی از قوانین GDPR نیز هست، همانطور که در ادامهی مقاله توضیح میدهیم، امنیت دادهها را تضمین نمیکنند.
یادآوری: متخلص سازی به این معنا است که دادههای شخصی به شیوهای پردازش شوند که بدون استفاده از برخی اطلاعات اضافی، نتوان آنها را بهعنوان دادههای یک موضوع خاص تشخیص داد.
مثال زیر را در نظر بگیرید. دو خردهفروشی تصمیم میگیرند از طریق به اشتراکگذاری متقابل دادههای شخص دوم، با یکدیگر مشارکت کنند. اگرچه خردهفروشی B همهی اطلاعات قابلشناسایی شخصی را از دادههای خود حذف کرده است، ولی نمیتوان گفت که دادهها واقعاً ناشناس هستند. زیرا دادههایی که ترکیبی از محدوده سنی، نشانگر زمانی، جنسیت و کد پستی هستند، یک رکورد جمعیتی منحصربهفرد را خلق میکنند که مرتبط کردن آن با اطلاعات اضافی خردهفروشی B، غیرممکن نیست. بنابراین گرچه این خردهفروشیها قوانین تصویبشده را رعایت میکنند، ولی طی این پروسه، دادههای مصرفکنندگان با ریسک بسیار بالایی روبرو است.
نقش دادههای ترکیبی در حفاظت حریم شخصی
در اغلب کشورها آژانسهای دولتی که اطلاعات حساسی را جمعآوری میکنند، طبق قانون موظفاند دادهها را بهصورت عمومی به اشتراک بگذارند. این آژانسها دادههای اصلی را طی یک پروسه، به دادههای محافظتشده تبدیل و سپس منتشر میکنند. در این رویکرد، متغیرهای حساس دادهها بهطور سیستماتیک و از طریق یکی از روشهای زیر، تعدیل میشوند. بیایید مثال خردهفروشیهایی را دنبال کنیم که میخواهند دادههای فروش هفتگی را با یکدیگر به اشتراک بگذارند:
- اضافه کردن نویز تصادفی: مشاهدات در دهکهای مبتنی بر فروش گروهبندی میشوند و یک رقم رندوم به هر دهک اضافه میشود.
- گرد کردن: فروش به نزدیکترین رقم صدگان گرد میشود.
- کدگذاری بالا: تمام اقلامی که ارزش آنها از یک حد آستانه (مثلاً ۱۰۰) بالاتر است، معادل ۱۰۰ در نظر گرفته میشوند.
- تعویض: مشاهدات به چندین گروه تقسیم میشوند و دادههای فروش گروههای مختلف باهم جابجا میشود.
- تجمیع: مجموع فروش هفتگی و میانگین قیمتها و پروموشنها را به همهی فروشگاههای حاضر در یک بازار نسبت میدهند.
- ایجاد دادههای مصنوعی: فروش از یک توزیع احتمالی شبیهسازی میشود.
سازمانهای بزرگ غالباً با استفاده از این پروسهها که «اختلال در دادهها» نامیده میشوند، اطلاعات مفید را در میان دادههای اصلی محفوظ نگه میدارند و درعینحال، شانس نقض حریم خصوصی را کاهش میدهند. دادههای اصلی در یک فضای دسترسی امن نگهداشته میشوند، مگر اینکه زمانی حذف برخی از آنها ضروری باشد. کارشناسان معتقدند که شرکتها نیز باید برای تقویت شیوههای محافظت از دادههای خود، نگاهی هم به رویکردهای فوق داشته باشند.
یکی از راههای تبدیل دادههای اصلی بازاریابی به دادههای ترکیبی، استفاده از مدلهای آماری است. ایدهی اصلی مدلهای آماری، این است که اهداف بازاریابی (که دادههای مربوط به آن جمعآوریشده) در یک پروسهی همگذاری مفروض شوند و سپس دادههای کاهشی و افزایشی را با دقت روی آن اعمال کنند.
بهعنوانمثال، یک فرم متداول از دادههایی را که بهطور گسترده مورداستفاده قرار میگیرند، در نظر بگیرید: دادههای فروش نقطهای خردهفروشیها. معمولاً شرکتهای تحقیقات بازار، این دادهها را از سطح فروشگاهها جمعآوری میکنند. سپس با روش تجمیع همهی دادهها را ترکیب میکنند تا هیچ فروشگاه خاصی بهطور مجزا قابلشناسایی نباشد. خریداران این دادهها عمدتاً شرکتهای بزرگ بستهبندی محصولات مصرفی هستند. مدیران برندها نیز به کمک همین دادهها عملکرد برند و متریکهای بازاریابی نظیر کشش قیمتی و فاکتورهای ارتقای تبلیغات را ارزیابی میکنند. اما رویکرد تجمیع ممکن است متریکهایی را که مبنای تصمیمگیریهای مهم مدیران هستند (مانند تعیین بودجهی تبلیغات تجاری) دچار انحراف کنند. اینجا هم یکی از روشهای محافظت از هویت فروشگاهها این است که با استفاده از یک مدل آماری، دادههای اصلی را به دادههای مصنوعی یا ترکیبی تبدیل کنیم. تحقیقات نشان میدهد که این روش دادههای بهمراتب صحیحتری را به مدیران عرضه میکند و درعینحال هویت فروشگاهها را محفوظ نگه میدارد.
جمعبندی نهایی: کسبوکارها در صورتی میتوانند از مزایای عالی بازاریابی مبتنی بر داده بهره ببرند که راهی برای غلبه بر ریسکهای آن و بهویژه جلوگیری از افشای ناخواستهی اطلاعات بیابند. رویکردهای کنونی نظیر کنترل سطح دسترسی و حذف اطلاعات شخصی قابلشناسایی، ریسکهای نشت اطلاعات را کاملاً مهار نمیکنند. رویکردهایی مانند روش تجمیع نیز کیفیت اطلاعات را شدیداً پایین میآورند. بهترین پیشنهاد فعلی کارشناسان این است که شرکتها با استفاده از مدلهای آماری، دادههای اصلی را به دادههای ترکیبی تبدیل کنند، تا هم تصمیمات بازاریابی بر اساس دادههای معتبری انجام شود و هم امنیت دادهها محفوظ بماند.