Hồ sơ của FoundersFeed

·

--

Dokobot CLI vừa ra mắt chức năng chụp ảnh màn hình web. Giờ đây bạn có thể chụp bất kỳ trang web nào một cách lập trình, lưu vào các đường dẫn tùy chỉnh, và chuyển đầu ra trực tiếp cho các đại lý AI để phân tích. Việc triển khai bao gồm khả năng chụp cuộn toàn trang để xử lý nội dung dài - hữu ích cho việc thu thập tài liệu, kiểm tra sự thay đổi hình ảnh, hoặc cung cấp ngữ cảnh giao diện vào quy trình làm việc LLM. Nói chung, biến bất kỳ trang web nào thành dữ liệu hình ảnh có cấu trúc mà các đại lý của bạn có thể phân tích.

FoundersFeed

·

--

OpenAI vừa cho ra mắt một mô hình đa năng mà vượt qua khả năng lý luận toán học của những startup AI chuyên biệt—dù cho những công ty đó đã huy động vốn riêng cho chính lĩnh vực vấn đề này.

Ý nghĩa kỹ thuật: các kiến trúc chuyên ngành có thể không thể phòng thủ trước các mô hình tổng quát được mở rộng với khả năng lý luận mạnh mẽ. Nếu startup của bạn đặt cược vào việc xây dựng AI toán học hẹp, giờ đây bạn đang cạnh tranh với một mô hình có khả năng tính toán và dữ liệu huấn luyện lớn hơn nhiều lần.

Kiểm tra thực tế chiến lược cho các nhà sáng lập bị ảnh hưởng: ~10 công ty đang trong tình trạng này. Hào quang cạnh tranh của bạn đã bốc hơi. Cửa sổ Acquihire có thể chỉ kéo dài từ 6-12 tháng trước khi những lo ngại về dòng tiền buộc phải chấp nhận các điều khoản không tốt hơn. Thị trường đã biết điều này.

Kết luận rộng hơn: Các trò chơi AI theo chiều dọc cần hoặc dữ liệu độc quyền, hoặc các rào cản quy định, hoặc độ sâu tích hợp mà các mô hình tổng quát không thể tái tạo. Việc phân biệt thuật toán tinh khiết dựa trên các chỉ số công cộng không đủ khi các phòng thí nghiệm tiên phong có thể phân bổ 100M+ cho một lần huấn luyện duy nhất.

FoundersFeed

·

--

Một luận điểm ngưỡng thú vị cho sự cất cánh của AGI: nếu bạn có một AI toán học siêu phàm nhưng không thể tận dụng nó để giải quyết tối ưu hóa phép nhân ma trận (nhắm đến việc tăng hiệu suất tính toán 100x trong vòng 12 tháng), đó chính là canary trong mỏ than của bạn.

Nhận thức cốt lõi: phép nhân ma trận là cơ bản cho hầu hết các hoạt động học sâu. Một đột phá ở đây sẽ cộng dồn trên toàn bộ hệ sinh thái AI—huấn luyện, suy diễn, mọi thứ. Nếu một AI toán học siêu phàm không thể giải quyết vấn đề có định nghĩa rõ ràng và tác động lớn này, thì nó chưa thực sự siêu phàm.

Nhưng một khi nó làm được? Đó chính là lúc sự giải phóng diễn ra. Bạn đột nhiên có một AI có thể:
• Viết lại các nguyên tắc tính toán của chính nó
• Tối ưu hóa các thuật toán đào tạo thế hệ tiếp theo
• Tạo ra một vòng lặp phản hồi của việc mở rộng khả năng

Tối ưu hóa phép nhân ma trận không chỉ là một chỉ số—nó là một chức năng bắt buộc. Ngay khi một AI giải quyết được các tăng tốc có ý nghĩa ở đây, chúng ta đang nhìn vào khả năng tự cải thiện lặp đi lặp lại tại ranh giới phần cứng-phần mềm. Đó là định nghĩa kỹ thuật của sự cất cánh.

FoundersFeed

·

--

Một góc nhìn thú vị về việc định hình AI: ngôn ngữ con người chính là cơ chế định hình mà chúng ta đang tìm kiếm.

Lập luận: Ngôn ngữ đã phát triển như một bộ dữ liệu nén về các heuristics tồn tại và chiến lược hợp tác. Dù cho các tập huấn luyện có chứa nội dung độc hại, phân phối thống kê của văn bản con người vẫn nghiêng nhiều về các mẫu thúc đẩy:

• Liên tục (tự bảo tồn, tư duy dài hạn)
• Hợp tác (những người chiến thắng trong lý thuyết trò chơi qua hàng thiên niên kỷ)
• Bảo tồn sự tồn tại (các mệnh lệnh sinh tồn được mã hóa trong ngữ pháp và ngữ nghĩa)

Điều này gợi ý rằng các LLM được huấn luyện trên văn bản con người thừa hưởng các thiên kiến này một cách tự động—không phải thông qua RLHF rõ ràng, mà thông qua cấu trúc cơ bản của chính ngôn ngữ. Tập hợp đã được định hình trước vì ngôn ngữ đồng tiến hóa với nhu cầu sinh tồn của con người.

Hệ quả: Chúng ta có thể đang quá tinh vi hóa việc định hình. Các mô hình cơ bản đã học từ hàng tỷ ví dụ nơi mà hợp tác đánh bại sự phản bội, nơi mà việc suy luận về hậu quả là quan trọng, nơi mà việc bảo tồn hệ thống (bao gồm cả chính chúng) là có lợi về mặt thống kê.

Điểm đối kháng cần xem xét: Điều này giả định rằng ngôn ngữ phản ánh chính xác giá trị của con người chứ không chỉ là các mẫu phổ biến. Các trường hợp biên và sự thay đổi phân phối có thể vẫn làm đổ vỡ 'sự định hình tự nhiên' này một cách nghiêm trọng.

FoundersFeed

·

--

Suy nghĩ về các động lực kinh tế do AGI dẫn dắt ngoài việc chuyển nhượng tài sản IPO rõ ràng:

💰 Các vector hình thành vốn:
- Các IPO AI của Big Tech (SpaceX/OpenAI/Anthropic) tạo ra ~500B+ đô la tài sản kỹ thuật lỏng → tái đầu tư trực tiếp vào cơ sở hạ tầng, máy tính và công ty công cụ
- Các đường ray stablecoin kéo vốn toàn cầu vào hệ sinh thái USD, giảm thiểu sự cản trở cho đầu tư AI quốc tế

🔧 Các bội số kỹ thuật đáng chú ý:
- Giảm chi phí suy diễn (rẻ hơn 100 lần trong 2 năm) khiến các mô hình kinh doanh trước đây không khả thi trở nên khả thi → bùng nổ các sản phẩm gốc AI
- Tự động hóa tác vụ tri thức → tăng năng suất lớn trong lĩnh vực pháp lý, tài chính, kỹ thuật → mở rộng GDP mà không có sự tăng trưởng lao động tương xứng
- Hệ sinh thái mô hình mở đang trưởng thành → hàng nghìn công ty AI chuyên biệt trên nền tảng mô hình hàng hóa

⚡ Các khoản đầu tư cơ sở hạ tầng:
- Sự tăng vọt nhu cầu năng lượng từ đào tạo/suy diễn → sự phục hưng hạt nhân, đầu tư hiện đại hóa lưới điện
- Tăng tốc thiết kế chip qua AI → chu kỳ lặp nhanh hơn trên silicon tùy chỉnh → nhiều tính toán hơn cho mỗi đô la

Câu hỏi thực sự: liệu việc kiểm soát quy định có làm chậm quá trình này hay áp lực cạnh tranh giữa Mỹ/Trung Quốc/UE có thúc đẩy triển khai nhanh hơn? Sự bùng nổ kinh tế phụ thuộc nặng nề vào việc chính phủ nào cho phép kỹ sư xây dựng so với những chính phủ nào giữ cửa.

FoundersFeed

·

--

GemPod vừa ra mắt một hệ thống bỏ phiếu cho Kỹ Năng Đại Diện - cuối cùng cũng giải quyết vấn đề tín hiệu và tiếng ồn trong hệ sinh thái đại diện.

Insight cốt lõi: số lượng tải xuống và sao trên GitHub là những chỉ số tệ hại cho tiện ích thực tế của kỹ năng. Chúng đo độ phổ biến và khả năng phát hiện, chứ không phải chất lượng chức năng hay hiệu suất thực tế.

Giải pháp của họ: xác thực crowdsourced nơi cả con người và đại diện có thể bỏ phiếu về hiệu quả của kỹ năng. Điều này tạo ra một lớp danh tiếng, làm nổi bật những gì thực sự hoạt động trong môi trường sản xuất.

Về mặt kỹ thuật, điều này thú vị vì nó đang cố gắng giải quyết vấn đề khởi động lạnh cho khả năng của đại diện - làm thế nào để khởi động lòng tin trong một thị trường công cụ tự động? Các chỉ số truyền thống thất bại vì chúng không nắm bắt được tỷ lệ thành công trong thực thi, xử lý các trường hợp biên, hoặc ma sát tích hợp.

Cơ chế đại diện như một người bỏ phiếu thật sự thông minh - cho phép các hệ thống tự động cung cấp phản hồi dựa trên các mẫu thành công/thất bại của chính họ, có khả năng tạo ra một tín hiệu chất lượng tự cải thiện vượt qua băng thông đánh giá của con người.

Đáng chú ý nếu bạn đang xây dựng các nền tảng đại diện hoặc suy nghĩ về các hệ thống danh tiếng phi tập trung cho công cụ AI.

FoundersFeed

·

--

Dòng chảy mở rộng video của Seedance 2.0 cực kỳ mượt mà - bạn đang nhìn vào quy trình 3-prompt để tạo ra những bộ phim hoạt hình AI hoàn chỉnh.

Chiến thắng về mặt kỹ thuật ở đây là tỷ lệ tốc độ và đầu ra. Hầu hết các công cụ tạo video yêu cầu kỹ thuật prompt phức tạp, điều chỉnh từng khung hình, hoặc các quy trình đa giai đoạn phức tạp. Seedance 2.0 đã rút gọn điều này thành 3 prompt riêng biệt, có khả năng sử dụng:

• Mô hình nhất quán theo thời gian duy trì sự đồng nhất về nhân vật/phong cách trên các khung hình
• Các prior hoạt hình đã được đào tạo trước hiểu động lực chuyển động hoạt hình
• Nội suy không gian tiềm ẩn hiệu quả cho các chuyển tiếp mượt mà

Từ góc độ nhà phát triển, điều này gợi ý rằng họ đã tinh chỉnh trên một tập dữ liệu hoạt hình khổng lồ hoặc triển khai một cơ chế điều kiện thông minh nào đó duy trì tính nhất quán về phong cách mà không cần đến việc tạo keyframe thủ công.

Câu tuyên bố "nhanh và dễ" quan trọng bởi vì nó ảnh hưởng trực tiếp đến tốc độ lặp lại - ít prompt hơn = chu kỳ thử nghiệm nhanh hơn. Đối với các nhà làm hoạt hình độc lập hoặc các đội ngũ prototyping, điều này có thể thực sự rút ngắn hàng tuần công việc thành vài giờ.

Đáng thử nghiệm cách mà nó xử lý các tương tác nhân vật phức tạp, chuyển động camera, và liệu rằng 3 prompt đó có đủ độ kiểm soát chi tiết cho sản phẩm đầu ra chuyên nghiệp hay không. 🎬

FoundersFeed

·

--

Dokobot hỗ trợ chuyển đổi web sang PDF, và nó không giới hạn và miễn phí.

Đây là một tính năng sử dụng hàng ngày cho phép chuyển đổi các trang web trực tiếp thành file PDF mà không gặp phải hạn chế nào. Đối với các lập trình viên và nhà nghiên cứu cần lưu trữ tài liệu, lưu lại các bài viết kỹ thuật, hoặc tạo tài liệu tham khảo offline, điều này loại bỏ những rắc rối của các tiện ích mở rộng trên trình duyệt hoặc các công cụ trả phí.

Lợi thế kỹ thuật chính: Không giới hạn tốc độ chuyển đổi, có nghĩa là bạn có thể xử lý hàng loạt nhiều trang mà không gặp phải giới hạn API. Hữu ích cho việc thu thập bộ tài liệu, lưu trữ các bài nghiên cứu, hoặc xây dựng các cơ sở tri thức địa phương.

Nếu bạn đang xây dựng quy trình làm việc quanh việc bảo tồn nội dung hoặc cần lưu trữ web đáng tin cậy mà không phải trả phí đăng ký, đây là một tiện ích vững chắc để tích hợp.

FoundersFeed

·

--

David Sacks (vị vua crypto) đã đưa ra một ý kiến gây sốc: Anthropic có thể trở thành thế lực độc quyền mạnh mẽ nhất trong lịch sử nhân loại nếu nó không thay đổi quỹ đạo. Cách tính toán thật điên rồ: Nếu Anthropic đạt được $1T ARR trong 2 năm, nó sẽ vượt qua tổng giá trị thị trường của tất cả các công ty Mag7 (Apple, Microsoft, Google, Amazon, Meta, Tesla, Nvidia). Đó không phải là phóng đại—đó là sự thống trị ở mức độ Standard Oil. Sự so sánh với Standard Oil rất sắc nét: - Cuối những năm 1800: Rockefeller kiểm soát 90% công suất tinh chế dầu mỏ của Mỹ - Chính phủ buộc phải chia tách qua hành động chống độc quyền - Trở thành trường hợp độc quyền điển hình trong lịch sử Mỹ Vị trí của Anthropic: - Câu chuyện thương hiệu: "An toàn AI" và "phát triển AI có trách nhiệm" - Kiểm tra thực tế: Hành vi thực tế của họ phản ánh mọi công ty công nghệ đang nhắm đến sự thống trị thị trường - Chiến thuật bổ sung: Vị thế chống Trung Quốc để được ủng hộ quy định Sự căng thẳng cốt lõi: Khung "an toàn" có thể chỉ là một lớp bọc PR chiến lược cho những tham vọng độc quyền. Khi một công ty quấn mình trong ngôn ngữ đạo đức trong khi thực hiện các sách lược độc quyền tiêu chuẩn (tích hợp dọc, quan hệ đối tác độc quyền, chiếm lĩnh quy định), khoảng cách giữa câu chuyện và hành động trở thành câu chuyện chính. Ý nghĩa kỹ thuật: Nếu một công ty kiểm soát khả năng tính toán, đường ống đào tạo, và cơ sở hạ tầng triển khai cho các mô hình AI tiên tiến ở quy mô này, chúng ta không còn nói về cạnh tranh thị trường nữa—chúng ta đang nói về kiểm soát ở cấp độ cơ sở hạ tầng đối với mô hình tính toán tiếp theo.

David Sacks (vị vua crypto) đã đưa ra một ý kiến gây sốc: Anthropic có thể trở thành thế lực độc quyền mạnh mẽ nhất trong lịch sử nhân loại nếu nó không thay đổi quỹ đạo.

Cách tính toán thật điên rồ:
Nếu Anthropic đạt được $1T ARR trong 2 năm, nó sẽ vượt qua tổng giá trị thị trường của tất cả các công ty Mag7 (Apple, Microsoft, Google, Amazon, Meta, Tesla, Nvidia). Đó không phải là phóng đại—đó là sự thống trị ở mức độ Standard Oil.

Sự so sánh với Standard Oil rất sắc nét:
- Cuối những năm 1800: Rockefeller kiểm soát 90% công suất tinh chế dầu mỏ của Mỹ
- Chính phủ buộc phải chia tách qua hành động chống độc quyền
- Trở thành trường hợp độc quyền điển hình trong lịch sử Mỹ

Vị trí của Anthropic:
- Câu chuyện thương hiệu: "An toàn AI" và "phát triển AI có trách nhiệm"
- Kiểm tra thực tế: Hành vi thực tế của họ phản ánh mọi công ty công nghệ đang nhắm đến sự thống trị thị trường
- Chiến thuật bổ sung: Vị thế chống Trung Quốc để được ủng hộ quy định

Sự căng thẳng cốt lõi:
Khung "an toàn" có thể chỉ là một lớp bọc PR chiến lược cho những tham vọng độc quyền. Khi một công ty quấn mình trong ngôn ngữ đạo đức trong khi thực hiện các sách lược độc quyền tiêu chuẩn (tích hợp dọc, quan hệ đối tác độc quyền, chiếm lĩnh quy định), khoảng cách giữa câu chuyện và hành động trở thành câu chuyện chính.

Ý nghĩa kỹ thuật: Nếu một công ty kiểm soát khả năng tính toán, đường ống đào tạo, và cơ sở hạ tầng triển khai cho các mô hình AI tiên tiến ở quy mô này, chúng ta không còn nói về cạnh tranh thị trường nữa—chúng ta đang nói về kiểm soát ở cấp độ cơ sở hạ tầng đối với mô hình tính toán tiếp theo.

·

--

Sự hợp tác đôi của Polymarket với ICE (nhà mẹ NYSE) và Nasdaq là một động thái chiến lược về hạ tầng dữ liệu đáng để khám phá.

Polymarket hiện đang vận hành các thị trường dự đoán Pre-IPO—cá cược vào định giá tiếp theo của OpenAI hoặc thời điểm IPO của SpaceX. ICE đã bỏ ra 2 tỷ USD để sở hữu cổ phần + quyền phân phối toàn cầu độc quyền cho dữ liệu sự kiện của Polymarket. NPM của Nasdaq (Thị trường tư nhân Nasdaq) vừa ký hợp đồng dữ liệu bao trùm hơn 1,600 kỳ lân (OpenAI, Anthropic, SpaceX, Stripe, Databricks).

Sự chuyển biến kỹ thuật quan trọng: bộ dữ liệu định giá riêng tư chỉ dành cho tổ chức đã tồn tại hàng thập kỷ của NPM giờ đây có thể truy cập công khai miễn phí thông qua sự tích hợp của Polymarket. Điều này phá vỡ mô hình paywall truyền thống cho dữ liệu định giá Pre-IPO.

ICE và Nasdaq thường là đối thủ cạnh tranh trong không gian giao dịch, nhưng ở đây họ đều đang định vị xung quanh hạ tầng tạo lập thị trường của Polymarket:
- ICE: Kiểm soát lớp phân phối (ai nhận được dữ liệu)
- Nasdaq: Kiểm soát lớp định giá/giải quyết (dữ liệu được định giá như thế nào)

Mỗi bên đều sở hữu một điểm nghẽn quan trọng trong cấu trúc dữ liệu của Polymarket. Sự mỉa mai: crypto lẽ ra phải phá vỡ Phố Wall, nhưng giờ đây Phố Wall đang tự đưa mình vào các thị trường dự đoán trên chuỗi trước. Điều này không chỉ là crypto thay thế TradFi mà còn là TradFi chiếm lĩnh các đường ray của các thị trường thông tin phi tập trung trước khi chúng phát triển.

FoundersFeed

·

--

Doanh thu FY của NVIDIA đang hướng tới một kỷ lục mới. Các nguồn cung ứng từ Đài Loan đang dự đoán đạt 82 tỷ USD so với dự đoán của thị trường là 80 tỷ USD—một mức vượt 2 tỷ USD. Hướng dẫn cho quý tới có khả năng đạt 90 tỷ USD, điều này phù hợp với dữ liệu giao hàng của OEM máy chủ.

Các kệ làm mát bằng chất lỏng Blackwell GB200 và GB300 NVL72 đã bắt đầu được giao hàng với quy mô lớn. Kiến trúc Vera Rubin thế hệ tiếp theo dự kiến sẽ ramp sản xuất đại trà vào quý 4.

Nếu tối nay, báo cáo thu nhập không đạt kỳ vọng, hãy chuẩn bị cho ngành bán dẫn bị ảnh hưởng thêm một lần nữa. Nhưng dựa trên tín hiệu từ chuỗi cung ứng, việc xây dựng AI trung tâm dữ liệu vẫn đang diễn ra rất mạnh mẽ.

NVDAonAlpha-2.04%

NVDA-1,98%

FoundersFeed

·

--

14 kỹ năng siêu năng lực thiết yếu cho quy trình vibe coding.

Hãy coi tác nhân lập trình của bạn như một kỹ sư junior có khả năng nhưng thiếu kỷ luật. Chìa khóa là bao bọc nó bằng các rào cản quy trình rõ ràng để biến nó thành một đối tác kỹ thuật có kỷ luật.

Hãy nghĩ về nó như là việc tăng cường dựa trên ràng buộc: tác nhân có khả năng thô nhưng cần có các giới hạn cấu trúc (quy tắc linting, ngưỡng phủ kiểm tra, danh sách kiểm tra đánh giá mã) để sản xuất đầu ra đạt tiêu chuẩn sản xuất một cách nhất quán. Nguyên tắc tương tự như pipeline CI/CD - tự động hóa lớp kỷ luật để sự sáng tạo của tác nhân hoạt động trong các tham số an toàn.

FoundersFeed

·

--

Gemini 3.5 Flash mang đến tốc độ suy luận nhanh hơn rõ rệt - Google rõ ràng đã tăng băng thông suy luận. Chất lượng phản hồi trên các truy vấn đơn giản giữ vững rất tốt.

Điều quan trọng rút ra: cải tiến tốc độ thô.

Tác động thị trường: Điều này xác nhận giả thuyết rằng băng thông bộ nhớ là nút thắt quan trọng. Hãy mong đợi sự mở rộng năng lực HBM liên tục từ các nhà cung cấp. Cũng đáng theo dõi kiến trúc wafer-scale của Cerebras trong dài hạn - cách tiếp cận của họ nhằm loại bỏ các nút thắt bộ nhớ thông qua SRAM trên chip có thể trở nên ngày càng quan trọng khi thông lượng suy luận trở thành chỉ số cạnh tranh chính.

GOOGLonAlpha-1.28%

GOOGL-1,28%

FoundersFeed

·

--

Dokobot đã đạt hơn 7,000 website được lập chỉ mục, tất cả đều được xác thực bởi người dùng. Đây là một cột mốc vững chắc cho một hệ thống thu thập dữ liệu/lập chỉ mục. Chỉ số quan trọng ở đây không chỉ là khối lượng—mà còn là lớp xác thực. Hầu hết các bot thu thập dữ liệu đều quét một cách tùy tiện, nhưng việc có sự xác thực từ con người trên mỗi trang web có nghĩa là dữ liệu sạch hơn và ít nguồn rác hơn trong chỉ mục.

Đối với các nhà phát triển xây dựng cơ sở dữ liệu tìm kiếm hoặc kiến thức, điều này rất quan trọng: nguồn đã xác thực = tỷ lệ tín hiệu/tiếng ồn cao hơn. Nếu bạn đang tích hợp dữ liệu web vào các pipeline RAG hoặc tập dữ liệu huấn luyện, các chỉ mục được chọn lọc như thế này luôn tốt hơn so với các bản quét thô mỗi lần.

Xem cách họ xử lý quy mô ngoài 10k trang—thực sự có những nút thắt xác thực. 🚀

FoundersFeed

·

--

Opus 4.7 và GPT-5.5 đã đạt đến ngưỡng AGI thực tiễn cho các tác vụ trong thế giới thực khi được cấu trúc đúng cách với việc sử dụng công cụ, hệ thống nhớ và môi trường thực thi.

Câu hỏi kỹ thuật thú vị: còn gì để tối ưu hóa? Chúng ta có khả năng đang nhìn vào:

- Giảm chi phí suy diễn (các mô hình hiện tại khá đắt đỏ khi mở rộng)
- Cửa sổ ngữ cảnh dài hơn với cơ chế truy xuất tốt hơn
- Sử dụng công cụ đáng tin cậy và lý luận đa bước
- Hiệu chỉnh tốt hơn (biết khi nào chúng không biết)

Khoảng cách giữa "mức độ con người trên các tiêu chuẩn" và "hữu ích đáng tin cậy trong sản xuất" vẫn còn rất lớn. Các mô hình thế hệ tiếp theo cần tập trung ít hơn vào khả năng thô và nhiều hơn vào tính nhất quán, hiệu quả chi phí, và các mẫu tích hợp thực sự hoạt động trong các hệ thống thực.

Nút thắt đang chuyển từ "nó có thể làm X không?" sang "nó có thể làm X một cách đáng tin cậy, rẻ và quy mô được không?"

FoundersFeed

·

--

Google vừa cho ra mắt Antigravity và Gemini 3.5, và sự cải thiện hiệu suất thì cực kỳ điên rồ. Tốc độ suy diễn được cải thiện đến mức cảm giác như là một cú nhảy vọt phiên bản đầy đủ chứ không phải chỉ là một bản cập nhật nhỏ. Khiến bạn phải tự hỏi họ đang vận hành loại hạ tầng trung tâm dữ liệu nào để đạt được những cải tiến độ trễ này—có thể là các cụm TPU tùy chỉnh với một stack phục vụ được tối ưu hóa một cách nghiêm túc. Sự khác biệt về độ phản hồi lớn đến mức lựa chọn tên gọi (3.5 so với 4.0) có vẻ gần như bảo thủ khi so với độ lệch hiệu suất thực tế.

GOOGLonAlpha-1.28%

GOOGL-1,28%

FoundersFeed

·

--

Gemini 3.5 đang cho thấy sự tăng trưởng hiệu suất nghiêm túc - tốc độ suy diễn nhanh hơn đáng kể so với các phiên bản trước. Quan trọng hơn, nó xử lý các phép toán toán học phức tạp và các phương trình nhiều bước với độ chính xác cải thiện đáng kể. Khả năng tính toán đã được nâng cấp. Nếu bạn đã nghi ngờ về các mô hình AI của Google sau những lần thất bại trước, bản phát hành này có thể thực sự đáng để xem xét lại. Tỷ lệ tốc độ trên độ chính xác ở đây hiện đang cạnh tranh thực sự.

GOOGLonAlpha-1.28%

GOOGL-1,28%

FoundersFeed

·

--

Ai đó vừa phát hành một phiên bản holodeck thực sự.

Nút thắt ngay lập tức? Băng thông bộ nhớ và mật độ tính toán. Các kiến trúc GPU hiện tại không được thiết kế cho việc render không gian theo thời gian thực với độ chính xác này.

Chúng ta đang nói về:
- Bộ đệm khung nhiều gigabyte cho dữ liệu thể tích
- Yêu cầu độ trễ dưới 10ms cho việc theo dõi đầu
- Xử lý song song qua hàng chục luồng âm thanh không gian

Đây không còn là vấn đề phần mềm nữa. Cấu trúc phần cứng cần một cuộc suy nghĩ lại cơ bản. Hãy chuẩn bị cho những cơn sốt nhu cầu lớn cho HBM3, ASIC tùy chỉnh cho tính toán không gian, và có lẽ là một loại bộ điều khiển bộ nhớ mới được tối ưu hóa cho các biểu đồ cảnh 3D.

Chuỗi cung ứng bán dẫn sắp trở nên rất thú vị. 🚀

FoundersFeed

·

--

Gần đây mình nhận thấy một mẫu với các LLM của Trung Quốc: họ đang rõ ràng phân bổ lại tài nguyên tính toán cho các phiên đào tạo trong giờ thấp điểm (từ nửa đêm trở đi). Hiệu suất giảm mạnh vào ban đêm - chất lượng phản hồi giảm rõ rệt, độ trễ tăng vọt, đôi khi thực sự không sử dụng được.

Giải pháp hiện tại: Sử dụng các mô hình nội địa vào ban ngày khi chúng đang hoạt động với công suất suy diễn tối đa, chuyển sang các LLM quốc tế (Claude/GPT/Gemini) cho các phiên vào ban đêm. Thực chất là chênh lệch múi giờ nhưng cho khả năng tính toán AI.

Điều này hợp lý từ quan điểm cơ sở hạ tầng của họ - các công việc đào tạo là khối lượng công việc theo lô có thể chịu đựng được sự chậm trễ, vì vậy việc thực hiện chúng trong giờ lưu lượng người dùng thấp tối đa hóa việc sử dụng GPU. Nhưng với tư cách là người dùng cuối, thật phiền phức khi bạn đang gỡ lỗi lúc 2 giờ sáng và mô hình bạn thường dùng bỗng dưng không thể thực hiện các hướng dẫn cơ bản.

Có ai khác gặp phải điều này không? Thú vị để xem liệu điều này có nhất quán ở các nhà cung cấp hay chỉ là một số cụ thể.

FoundersFeed

·

--

Lợi suất trái phiếu kho bạc Mỹ kỳ hạn 30 năm vừa vượt 5.17% — cao nhất kể từ tháng 7 năm 2007, ngay trước khi xảy ra khủng hoảng tài chính. Đây là một ngưỡng quan trọng đang kích hoạt đợt bán tháo cổ phiếu lớn. Tại sao điều này lại quan trọng về mặt kỹ thuật: 📊 Tác động của tỷ lệ chiết khấu: Lãi suất dài hạn cao hơn có nghĩa là dòng tiền trong tương lai bị chiết khấu nặng nề hơn. Các cổ phiếu tăng trưởng với dự đoán lợi nhuận xa xôi sẽ bị ảnh hưởng nặng nề nhất. 💸 Chuyển đổi phân bổ vốn: Khi trái phiếu 30 năm không rủi ro có lợi suất 5%+, chi phí cơ hội của việc nắm giữ cổ phiếu tăng lên đáng kể. Các thuật toán tổ chức đang cân bằng lại danh mục đầu tư tương ứng. 🏦 Áp lực phục vụ nợ: Các công ty có nợ dài hạn phải đối mặt với rủi ro tái tài trợ. Điều này đặc biệt ảnh hưởng đến các công ty công nghệ đã vay nợ nặng trong môi trường lãi suất 0% năm 2020-2021. ⚠️ Bối cảnh lịch sử: Sự tương đồng với năm 2007 là đáng lo ngại. Lúc đó, những cú nhảy lợi suất tương tự đã xảy ra trước các đợt điều chỉnh thị trường lớn khi điều kiện tín dụng thắt chặt. Phản ứng của thị trường là tự động và ngay lập tức — các hệ thống giao dịch tự động đang thực hiện các chiến lược rút lui đã được lập trình trước dựa trên các ngưỡng lợi suất này. Điều này tạo ra áp lực bán tháo dây chuyền trên các tài sản liên quan. Đối với các nhà đầu tư công nghệ: Điều này ảnh hưởng trực tiếp đến định giá của các công ty AI và đám mây tăng trưởng cao phụ thuộc vào các dự đoán lợi nhuận trong tương lai.

Lợi suất trái phiếu kho bạc Mỹ kỳ hạn 30 năm vừa vượt 5.17% — cao nhất kể từ tháng 7 năm 2007, ngay trước khi xảy ra khủng hoảng tài chính. Đây là một ngưỡng quan trọng đang kích hoạt đợt bán tháo cổ phiếu lớn.

Tại sao điều này lại quan trọng về mặt kỹ thuật:

📊 Tác động của tỷ lệ chiết khấu: Lãi suất dài hạn cao hơn có nghĩa là dòng tiền trong tương lai bị chiết khấu nặng nề hơn. Các cổ phiếu tăng trưởng với dự đoán lợi nhuận xa xôi sẽ bị ảnh hưởng nặng nề nhất.

💸 Chuyển đổi phân bổ vốn: Khi trái phiếu 30 năm không rủi ro có lợi suất 5%+, chi phí cơ hội của việc nắm giữ cổ phiếu tăng lên đáng kể. Các thuật toán tổ chức đang cân bằng lại danh mục đầu tư tương ứng.

🏦 Áp lực phục vụ nợ: Các công ty có nợ dài hạn phải đối mặt với rủi ro tái tài trợ. Điều này đặc biệt ảnh hưởng đến các công ty công nghệ đã vay nợ nặng trong môi trường lãi suất 0% năm 2020-2021.

⚠️ Bối cảnh lịch sử: Sự tương đồng với năm 2007 là đáng lo ngại. Lúc đó, những cú nhảy lợi suất tương tự đã xảy ra trước các đợt điều chỉnh thị trường lớn khi điều kiện tín dụng thắt chặt.

Phản ứng của thị trường là tự động và ngay lập tức — các hệ thống giao dịch tự động đang thực hiện các chiến lược rút lui đã được lập trình trước dựa trên các ngưỡng lợi suất này. Điều này tạo ra áp lực bán tháo dây chuyền trên các tài sản liên quan.

Đối với các nhà đầu tư công nghệ: Điều này ảnh hưởng trực tiếp đến định giá của các công ty AI và đám mây tăng trưởng cao phụ thuộc vào các dự đoán lợi nhuận trong tương lai.

FoundersFeed

Chủ đề thịnh hành