绯赤艾利欧吧 关注:4,965贴子:646,020

吧友们新年快乐😀,想听听吧友们对于vup数据分析软件的建议。

只看楼主收藏回复

新年新征程,lz计划整合资源,开发一个用于vup数据分析的程序,想了解一下吧友们的对这个程序的建议,有意思的想法也可以提,也许能做到。非常感谢您宝贵的意见。
构想的大致结构如下:
统计平台:主b;贴吧。(其他有什么有关的平台也行,海外不在考虑范围内)
采集数据类型:直播,视频,动态中的公开信息,文字信息为主。后期会完善图像,声音信息。


IP属地:上海来自Android客户端1楼2025-01-01 00:54回复
    分析:在采集部分完工之后开始制作,预计是使用GPT。分析部分旨在理解数据与行为的关系,是本项目的核心。
    存储:经过处理后的数据和分析将以文字和图,表的形式储存起来。


    IP属地:上海来自Android客户端2楼2025-01-01 00:54
    回复
      计划是先完成数据采集部分,积累数据在开发分析模块。在b的统计优先。


      IP属地:上海来自Android客户端3楼2025-01-01 00:59
      回复
        对于这个程序,它将与传统的数据统计网站有着明显的不同,不仅仅是在分析功能。数据采集方面也会有极大的拓展,我会将圈外相关的数据也进行统计,还有不同的人对事件的看法,以提供一个全局性的视野。发掘数据-行为-环境之间的关系,这是我设计这个程序的目的。


        IP属地:上海来自Android客户端4楼2025-01-01 01:14
        回复
          欢迎大家提供宝贵的意见


          IP属地:上海来自Android客户端5楼2025-01-01 01:15
          回复
            之前爬弹幕的网站好像都寄了,不知道能不能复刻


            IP属地:北京来自Android客户端6楼2025-01-01 01:30
            收起回复
              不懂帮顶


              IP属地:广东来自Android客户端7楼2025-01-01 02:56
              回复
                你说的太专业了,说点f87能看懂的话。
                统计数据的话也比较固定吧,营收弹幕同接。也是大家比较关心的


                IP属地:北京来自Android客户端8楼2025-01-01 04:44
                收起回复
                  现在好像没有准确的地方看了


                  IP属地:上海来自Android客户端9楼2025-01-01 08:45
                  收起回复
                    一般数据分析都是些量化数据,但感觉lz的野心不只传统的爬虫网站,希望用gpt分析文字图像来获得vup的活动逻辑(不知道lz要gpt干的是不是这个)。从技术上来说,gpt处理几张图片文字没有问题,但是现在的ai本来就患有严重的健忘症,如果一次性给gpt放入大量的图片和文字分析可能达不到理想效果。我觉得lz可以一点一点来,先试试gpt能做到什么程度,再慢慢加码,把其他部分完善。


                    IP属地:广东来自Android客户端10楼2025-01-01 10:29
                    收起回复
                      咋感觉是icu+那个在评论区可以看到用户成分分析的


                      IP属地:福建11楼2025-01-01 15:55
                      收起回复
                        吃力不讨好


                        IP属地:安徽来自Android客户端12楼2025-01-01 21:58
                        收起回复
                          b站原则上不支持你收集数据,先试试能不能做到同时收集大量v的基本完整的直播弹幕再说吧,这个已经很有用了


                          IP属地:广西来自Android客户端13楼2025-01-03 11:20
                          收起回复
                            https://playboard.co/en/不知道能不能帮到你


                            IP属地:江苏来自Android客户端14楼2025-01-07 18:57
                            回复
                              最基础的低频爬取的框架终于能成功运行了,nmd是有多tsj才能在15s间隔的情况下还有重复数据,整无语了。


                              IP属地:上海来自Android客户端15楼2025-01-07 22:07
                              收起回复